Image
image
image
image


Liste des robots de recherche qui visitent les sites référencés par RISI


Qu'est ce qu'un robot de recherche

Logiciel employé par les moteurs de recherche pour parcourir le web à la recherche des pages web qui le compose afin de les indexer . Le robot interroge en premier lieu le fichier robot.txt afin d'adapter son comportement aux desiderata du webmaster du site à indexer. Les pages trouvées sont analysées et intégrées à une base de données nommée index qui est interrogée par les internautes lors de leurs recherches. Les robots parcourent le web en suivant les liens hypertextes entre pages, d'ou l'importance de faire des plans de site et autres sitemap.

Outils entièrement automatiques, ils sont interrogeables par formulaire de requête.

Très puissants, ils explorent automatiquement les sites (sur les noms des documents, les titres, les mots du texte, le code source...),  et constituent ainsi un énorme stock de données à partir desquelles les questions posées trouvent des réponses.

Très utiles pour des questions précises, ils restent efficaces à condition d'éviter les termes polysémiques ou trop larges.

Inconvénients :  les résultats sont fournis en très grand nombre, les documents intéressants obtenus  sont mélés à des ressources dépourvues d'intérêt  et à une publicité envahissante.  

Les robots se différencient pricipalement par la taille et la qualité de leur corpus (pages indexées) et par leurs critères de présentation des résultats de requête.



cliquez sur les noms en bleu pour avoir une connaissance plus précise de tel ou tel robot

Visiteurs Robots/Spiders  
Liste des robots qui passent régulièrement sur les sites référencés par RISI Hits Bande passante Dernière visite
Yahoo Slurp 1538+205 29.60 Mo 22 Août 2007 - 04:19
MSNBot 360+280 12.16 Mo 22 Août 2007 - 04:20
Voila 320+314 5.39 Mo 22 Août 2007 - 04:09
Googlebot 250+27 10.02 Mo 22 Août 2007 - 01:55
SBIder 117+107 3.64 Mo 22 Août 2007 - 03:55
Unknown robot (identified by 'crawl') 134+63 3.87 Mo 17 Août 2007 - 00:12
Yahoo-MMCrawler 106+11 4.31 Ko 21 Août 2007 - 16:36
Unknown robot (identified by 'bot/' or 'bot-') 116+1 2.21 Mo 19 Août 2007 - 09:09
Speedy Spider 80+36 2.90 Mo 22 Août 2007 - 02:06
Unknown robot (identified by 'robot') 41+45 1.18 Mo 21 Août 2007 - 23:07
AskJeeves 25+21 1.66 Mo 20 Août 2007 - 18:18
Google AdSense 38+6 1.13 Mo 22 Août 2007 - 02:03
Unknown robot (identified by hit on 'robots.txt') 0+44 16.26 Ko 21 Août 2007 - 22:37
EchO! 43 1.50 Mo 13 Août 2007 - 21:24
Unknown robot (identified by 'spider') 26+6 1.37 Mo 22 Août 2007 - 01:34
GigaBot 21+11 735.96 Ko 21 Août 2007 - 18:38
Walhello appie 14+16 395.05 Ko 20 Août 2007 - 21:40
LinkWalker 13+13 4.85 Ko 20 Août 2007 - 01:31
Nutch 17+4 680.14 Ko 21 Août 2007 - 04:19
Internet Shinchakubin 13 20.06 Ko 21 Août 2007 - 09:37
Scooter 0+11 4.31 Ko 12 Août 2007 - 23:50
Asterias 7 0 20 Août 2007 - 08:44
SurveyBot 0+6 2.35 Ko 20 Août 2007 - 02:19
Alexa (IA Archiver) 3+3 316.15 Ko 21 Août 2007 - 19:03
MJ12bot 4+2 236.74 Ko 20 Août 2007 - 05:30
BaiDuSpider 3+2 210.32 Ko 16 Août 2007 - 05:37
The World Wide Web Worm 5 129.25 Ko 19 Août 2007 - 19:53
Turn It In 2+1 67.50 Ko 11 Août 2007 - 18:04
Girafabot 0+2 802 Octets 20 Août 2007 - 07:10
Perman surfer 1+1 30.06 Ko 02 Août 2007 - 05:23
Holmes 0+1 401 Octets 13 Août 2007 - 22:59
Robozilla 1 0 09 Août 2007 - 23:17
larbin 0+1 406 Octets 09 Août 2007 - 23:59
MSIECrawler 1 0 15 Août 2007 - 13:55




image


image
image