Propager la confiance et la méfiance dans les algorithmes de recherche

   
(English version - machine translation)


 
confiance

Quiconque s'intéresse au SEO et aux moteurs de recherche a déjà entendu parler de la notion de "TrustRank". Mais ce terme est trompeur et sa définition originale ne correspond pas à la façon dont Google envisage la confiance qu'il a dans un site. D'une façon générale, il existe de nombreux algorithmes permettant de propager des notions de confiance et, a contrario, de méfiance pour noter une page ou un site web et ainsi écarter le spam. En voici quelques exemples décrits dans cet article...

Début de l'article :


En réfléchissant au titre de l'article de ce mois-ci, nous nous sommes posés une question fondamentale : devions-nous y mettre le mot TrustRank, ou bien au contraire fallait-il l'éviter, pour que votre lecture ne commence pas sur un malentendu ? Comme vous le voyez, nous avons choisi de prendre le taureau par les cornes et d'en parler, sans le mettre dans le titre !

Dans cet article, nous allons donc évoquer les différents algorithmes qui ont été envisagés par les chercheurs dans le domaine de la recherche d'information pour propager la confiance, ou la non-confiance, sur le web. Si nous avons déjà évoqué le terme de TrustRank, c'est parce que cet algorithme, mis au point en 2004 par Zoltan Gyongyi, Hector Garcia-Molina et Jan Pedersen, est l'archétype des méthodes de propagation de la confiance. Son souci est qu'il a été longtemps confondu avec ce que Google appelait le trustrank, et qui n'avait pas de rapport (le vocable trustrank a d'ailleurs été abandonné par Google en 2009, qui lui a préféré le mot de personrank).

L'idée derrière la propagation de la confiance et de la non-confiance

L'idée de base est plutôt simple : le problème des méthodes qui calculent un score à partir des liens sur le web (comme le PageRank par exemple) est l'initialisation : si toutes les pages sont égales, les pages de spam finissent par gagner, car leur nombre est virtuellement infini. En revanche, si on sait repérer quelques pages qui sont de grande qualité et confiance, on va pouvoir s'en servir comme point de départ pour propager une information de qualité selon l'adage « les amis de mes amis sont mes amis ».

Inversement, si je repère quelques voyous, je vais partir du principe que les amis des malfaiteurs sont coupables par association. Ainsi une page de confiance qui fait un lien vers un tiers donnera un boost à ce tiers, et une page de faible qualité qui ferait un lien à un site tiers le plomberait, même légèrement.
...

La suite de cet article est accessible aux abonnés à la lettre professionnelle "Recherche et Référencement" du site Abondance...


Plus d'infos pour les abonnés :

Taille de l'article : 5 pages (format A4 Word)
Auteurs : Sylvain Peyronnet, co-fondateur et responsable des ix-labs, un laboratoire de recherche privé (http://www.peyronnet.eu/blog/) et Guillaume Peyronnet, gérant de Nalrem Médias (http://www.gpeyronnet.fr/nalrem-medias.html).

Formats disponibles : Word, PDF, HTML
Date de parution : 15 septembre 2014

- Télécharger l'article au format PDF

- Sommaire de la lettre R&R de septembre 2014

- Accès à la zone "Abonnés" du site Abondance.com


Plus d'infos pour les non-abonnés :

- Comment s'abonner à la lettre R&R ?

- Sommaire de la lettre R&R de septembre 2014

- Tous les articles de l'année 2014

- Sélection des meilleurs articles des 24 derniers mois


 
Un site du Réseau Abondance  : Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Formation DVD Référencement | Outils : Outiref - Visiref - Spider SimulatorDivers / Jeux : Googlefight - Googland |  Moteurs de recherche : Mozbot.fr - Mozbot.com - Grifil.net - SearchWings