Comment fonctionne un moteur de recherche ? (6ème partie : la lutte contre le spam)

   
(English version - machine translation)


 

Un moteur de recherche comme Google ou Bing est loin d'être un système simple pouvant être expliqué en quelques lignes. Il est au contraire l'addition de nombreuses technologies souvent assez complexes, lui permettant de renvoyer à l'internaute qui l'utilise les résultats les plus pertinents. Cette série d'articles vous explique donc quelles sont les différentes briques d'un moteur et vous dévoile les arcanes qui constituent leurs entrailles. Après nos précédents articles sur les technologies de crawl, l'index inversé, le duplicate content, le PageRank thématique, la pertinence et l'analysede la requête de l'internaute, nous abordons un sujet incontournable : la lutte contre le spam et la façon dont les moteurs de recherche détectent les techniques tentant de contourner leurs algorithmes. Explications...

Début de l'article :

Nous avons vu dans les articles des mois précédents comment fonctionnent la plupart des algorithmes utilisés par un moteur de recherche pour créer des classement et obtenir des résultats de bonne tenue. Mais on peut remarquer que si les moteurs n’en font pas plus, il devient très facile d’obtenir un bon positionnement en connaissant ces algorithmes.

On peut ainsi améliorer son “référencement” en créant des backlinks de qualité douteuses, en générant du contenu au kilomètre avec des techniques de content spinning ou avec de la rédaction bas de gamme, en achetant des domaines expirés et en faisant des redirections 301, etc.

Tous les webmasters essayent à leur niveau de manipuler le classement produit par Google. Et la couleur des chapeaux dont on aime s’affubler dans le SEO n’est rien d’autre qu’une graduation interne à la communauté, car dès qu’on a la volonté de manipuler les classements, le moteur va riposter.

Il est important pour les moteurs de recherche de lutter contre ces manipulations. En effet les résultats fournis peuvent être vus comme la recommandation du moteur sur la requête. Il est important que cette recommandation soit perçue comme la moins biaisée possible par les utilisateurs afin de garder leur confiance.

Cette riposte du moteur est continue et se trouve à tous les niveaux. Il va ainsi, dès le crawl et l’indexation, repérer les contenus ne méritant même pas d’être indexés ; au moment du calcul de l’importance il va diminuer l’impact de ce que l’on appelle des fermes de liens (sous forme de PBN pour Private Blog Networks chez les référenceurs web) ; lors de l’analyse de la pertinence, il va appliquer des filtres comme Panda ou Penguin par exemple. Le va-et-vient incessant entre l’attaque des uns et la défense des autres est d’ailleurs ce qui occupe quasiment à plein temps les discussions des référenceurs web, et qui permet à cette lettre d'exister (en partie)…

Dans cet article, nous allons discuter de ce qu’est le spam, et pourquoi il existe. Puis nous verrons une taxonomie du webspam et les familles de méthodes permettant de lutter contre celui-ci. Enfin nous évoquerons deux exemples de méthodes de filtrage.

La suite de cet article est accessible aux abonnés à la lettre professionnelle "Recherche et Référencement" du site Abondance...


Plus d'infos pour les abonnés :

Auteur : Auteurs : Thomas Largillier, Guillaume Peyronnet et Sylvain Peyronnet sont les fondateurs de la régie publicitaire sans tracking The Machine In The Middle (http://themachineinthemiddle.fr/).


Formats disponibles : HTML
Date de parution : 15 juin 2017

- Accès à la zone "Abonnés" du site Abondance.com


Plus d'infos pour les non-abonnés :

- Comment s'abonner à la lettre R&R ?

- Sommaire de la lettre R&R de Juin 2017

- Tous les articles de l'année 2017

- Sélection des meilleurs articles des 24 derniers mois

...

 
Un site du Réseau Abondance  : Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Formation DVD Référencement | Outils : Outiref - Visiref - Spider SimulatorDivers / Jeux : Googlefight - Googland |  Moteurs de recherche : Mozbot.fr - Mozbot.com - Grifil.net - SearchWings