Juillet-août 2009 > Les dernières évolutions de Google en matière de crawl

   
(English version - machine translation)


 
Résumé de l'article :

Pour créer et maintenir leur index à jour, les moteurs de recherche utilisent des logiciels appelés indifféremment "spiders", "crawlers", "bots" ou "agents". Ces outils, chargés de "crawler" le Web à la rencontre de nouvelles pages ou de nouvelles versions de pages déjà indexées, ont grandement évolué depuis une dizaine d'années. Cet article, très complet, explore ces différentes versions et évolutions de Googlebot, le spider de Google, qui n'a plus rien à voir aujourd'hui avec ce qu'il était lors de la naissance du moteur de recherche leader. Prêt à tenter l'aventure et à endosser votre habit de spider ?...

Début de l'article :


Avant de pouvoir servir des pages de résultats aux utilisateurs, les moteurs de recherche ont besoin de créer des index sophistiqués, après avoir "aspiré" le contenu du World Wide Web. Cette dernière tâche est réservée aux "crawlers" (On appelle également souvent les crawlers "spiders" ou "bots"), dont le plus connu est bien sûr Googlebot. L'importance de cette phase de crawl est souvent sous estimée par les webmasters. Or, le fait qu'une page ne soit pas crawlée au bon moment, ou pas crawlée du tout, a logiquement un impact très négatif sur le référencement et le positionnement de ces pages dans un moteur comme Google.

Nous allons voir tout d'abord que la tâche des crawlers est loin d'être facile, en raison des limitations techniques actuelles, mais aussi parce que les webmasters s'ingénient à rendre les choses difficiles pour ces programmes. Nous verrons ensuite comment Google en particulier a amélioré son système de crawl au fil du temps pour résoudre certaines de ces difficultés. Enfin, nous nous intéresserons aux évolutions récentes du crawl de Google, aux défis nouveaux qui se dressent devant les ingénieurs des outils de recherche, et nous donnerons en conclusion quelques recommandations opérationnelles pour surveiller le crawl de Google.


La suite de cet article est accessible aux abonnés à la lettre "Recherche et Référencement" du site Abondance...

Plus d'infos pour les abonnés :

Taille de l'article : 14 pages (format A4 Word)
Auteur : Philippe Yonnet, Directeur Technique @Position (http://www.aposition.com) et président de l'association SEO Camp (http://www.seo-camp.org/).

Formats disponibles : Word, PDF, HTML
Date de parution : 15 juillet 2009

Télécharger l'article au format PDF :
http://abonnes.abondance.com/archives/2009-07/

Sommaire de la lettre R&R de juillet-août 2009 :
http://abonnes.abondance.com/archives/2009-07/

Accès à la zone "Abonnés" du site Abondance.com :
http://abonnes.abondance.com/


Plus d'infos pour les non-abonnés :


Acheter cet article en ligne sur la Boutique Abondance ! Nouveau

Comment s'abonner à la lettre R&R ? :
http://commande.abondance.com/

Sommaire de la lettre R&R de juillet-août 2009 :
http://lettres.abondance.com/sommaire-RR-072009.html

Tous les articles de l'année 2009 :
http://lettres.abondance.com/articles-rechref-2009.html

Sélection des meilleurs articles des derniers mois : :
http://www.abondance.com/article-abonnes.html

 
Un site du Réseau Abondance  : Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Formation DVD Référencement | Outils : Outiref - Visiref - Spider SimulatorDivers / Jeux : Googlefight - Googland |  Moteurs de recherche : Mozbot.fr - Mozbot.com - Grifil.net - SearchWings