Sommaire de la lettre professionnelle Recherche et Référencement


Accueil Abondance.com > Lettre professionnelle "Recherche et Référencement"
 
Retrouvez ici chaque mois un descriptif des articles de la lettre professionnelle Recherche et Référencement du site Abondance...

jeudi 16 septembre 2010 


Google, Caffeine et l'évolution des robots d'exploration
Partager   Envoyer a un ami Version imprimable


Qu'on les appelle "robots", "spiders", "bots" ou "crawlers", les logiciels capables d'explorer les sites web pour mettre à jour leurs index ont toujours été utilisés par les moteurs de recherche. Mais les techniques ont changé depui sbientôt 20 ans. Entre les "traitements par lots" du début et le système mis en place par Google pour sa dernière mise à jour d'indexation Caffeine, il y a un monde que cet article se propose de vous faire découvrir. De quoi apporter quelques solutions aux webmasters qui ont connu quelques soucis d'indexation de leurs pages dans Gogle ces derniers mois...

Cet article fait partie de la Lettre Recherche et Référencement #118 du mois de septembre 2010



Début de l'article :

Les robots d'exploration des moteurs de recherche, que l'on appelle plus volontiers "crawlers", "spiders" ou "bots" sont l'un des composants-clé des moteurs de recherche. Malgré leur simplicité conceptuelle, la mise en œuvre des robots d'exploration de haute performance représente un défi d'ingénierie d'envergure en raison de la taille gigantesque du Web, et de l'évolution toujours plus rapide des pages.

Afin d'explorer une fraction substantielle du Web dans un laps de temps raisonnable, les robots d'exploration doivent télécharger des milliers de pages par seconde, et sont généralement répartis sur des dizaines ou des centaines d'ordinateurs. Leurs deux principales structures de données - la "frontière" (liste d'URL non encore explorées) et l'ensemble des URL déjà découverts - sont trop importantes pour entrer dans la mémoire principale, quels que soient les astuces trouvées pour "compresser" les URL et les données. La volonté de donner la priorité de l'exploration vers des pages de haute qualité et de préserver la fraîcheur de l'index impose des défis d'ingénierie supplémentaires.

Enfin, à ces défis techniques s'ajoute une contrainte : celle de rester "poli" envers les serveurs web, c'est à dire d'éviter de perturber et/ou de surcharger ceux-ci.

Dans le même temps, la course à la fraîcheur et à la rapidité est lancée dans le petit monde des moteurs de recherche : après la recherche "temps réel", on parle maintenant de recherche "instantanée".

Dans cet article, nous allons nous intéresser à la manière dont Google semble intégrer cette contrainte de "politesse" dans sa manière de crawler nos sites webs, et nous demander quelles évolutions Caffeine a réellement apporté dans les méthodes de crawl de Google ?


La suite de cet article est accessible aux abonnés à la lettre "Recherche et Référencement" du site Abondance...

Plus d'infos pour les abonnés :

Taille de l'article : 9 pages (format A4 Word)
Auteur : Philippe Yonnet, Global SEO Strategist, WEB DMUK (Londres) – Easyroommate / Vivastreet.

Formats disponibles : Word, PDF, HTML
Date de parution : 15 septembre 2010

Télécharger l'article au format PDF :
http://abonnes.abondance.com/archives/2010-09/

Sommaire de la lettre R&R de septembre 2010 :
http://abonnes.abondance.com/archives/2010-09/

Accès à la zone "Abonnés" du site Abondance.com :
http://abonnes.abondance.com/


Plus d'infos pour les non-abonnés :


Comment s'abonner à la lettre R&R ? :
http://commande.abondance.com/

Sommaire de la lettre R&R de septembre 2010 :
http://lettres.abondance.com/sommaire-RR-092010.html

Tous les articles de l'année 2010 :
http://lettres.abondance.com/articles-rechref-2010.html

Sélection des meilleurs articles des derniers mois : :
http://www.abondance.com/article-abonnes.html


0 Commentaires:

Poster un nouveau commentaire


<< Accueil



feed xml
 
Pour tout savoir sur le livre "Réussir son référencement web, 2ème édition" (Eyrolles, novembre 2009), consultez le site Livre Référencement !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 

 

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire (gratuite)
Recherche & Référencement : lettre professionnelle mensuelle (payante)


 
 Recherche sur le site Abondance :

Tout Abondance Toute l'actu depuis 1998


 

 

Messages précédents

 
RecordedFuture, la boule de cristal du Web ?
Etude sur le référencement en France (Benchmark)
Google relance la vente de marques en tant que mot...
Revue de moteurs (septembre 2010)
L'impact de Mayday, Jazz et Caffeine sur Google
PubSubHubbub, Ping et indexation en temps réel
Google et Bing : allons-nous vers une stratégie de...
Quora, une amélioration des outils sociaux actuels...
Le statut juridique des liens hypertexte
Revue de moteurs (juillet-août 2010)

 

Archives

 
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
septembre 2008
octobre 2008
novembre 2008
décembre 2008
janvier 2009
février 2009
mars 2009
avril 2009
mai 2009
juin 2009
juillet 2009
septembre 2009
octobre 2009
novembre 2009
décembre 2009
janvier 2010
février 2010
mars 2010
avril 2010
mai 2010
juin 2010
juillet 2010
septembre 2010
octobre 2010
novembre 2010
décembre 2010
janvier 2011
février 2011
mars 2011
avril 2011
mai 2011
juin 2011
juillet 2011
septembre 2011
octobre 2011
novembre 2011
décembre 2011
janvier 2012
février 2012
mars 2012
avril 2012
mai 2012

 
Chercher sur le Web avec Mozbot :

Chercher sur :
Web international
Web francophone
Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Forums Abondance - Baromètre Référencement - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Habitants - Googland - Grifil.com
Moteurs de recherche : Mozbot.fr - Mozbot.com - Mozbot.co.uk - Goossip - Motref - Rugby engine - Grifil.net - Biomalin - Foot Engine - SearchWings
Applicatifs du site Abondance réalisés par les sociétés Brioude Internet Référencement et Iseom