Algorithme Panda, faits et mythes
Les modifications de l'algorithme du 11 avril 2011 ont surpris les webmasters et ont suscité des quantité de théories sur ce que Google veut pénaliser effectivement.
Les faits
Google veut supprimer de la partie visible de l'index les pages à faible contenu
Par faible contenu, on désigne les textes et images qui ont peu de liens retour indépendants, en fait.
Un site est pénalisé dans son ensemble si une partie des pages est jugée de pauvre contenu
Cela a été confirmé officiellement. La pénalisation peut être légère ou importante selon la proportion de pages à faible contenu. Ainsi des pages qui étaient en tête des résultats, peuvent perdre plusieurs positions et apparaître derrière des liens sur des pages d'interêt moindre ou qui sont à coté de la question, cela parce que le site est pénalisé.
La pénalisation est quasiment irréversible
Elle n'affecte pas des pages mais attribue un score négatif au site dans son entier qui dépend du nombre de backlinks. Un site pénalisé ayant moins de chance d'obtenir des BL, il ne peut retrouver son trafic.
Pour l'annuler, il faut ajouter de nouvelles pages au contenu riche, afin d'améliorer le score du site, et aussi améliorer les pages au contenu pauvre et qui n'ont pas de backlinks. Objectivement est "pauvre" ce qui fait pandaliser un site. (voir l'article sur l' algorithme Panda).
Les choses sont différentes lorsque le site a un contenu dupliqué, car cela déclenche une pénalité différente.
Google sait qu'il pénalise injustement des sites
Google conseille de: "combiner des pages superficielles pour faire un contenu plus utile". On ne combine pas du spam pour faire un contenu utile, le conseil s'adresse bien aux webmasters de bonne foi.
Panda n'a qu'un seul but: combattre les spams. Pour empêcher les spammeur de progresser par essais et erreurs, on sanctionne le site tout entier ce qui empêche de savoir quelle partie est visée et on n'annule pas la pénalité quand le contenu jugé pauvre est supprimé.
En pénalisant un site entier pour une partie du contenu on sait qu'on peut aussi pénaliser un contenu de qualité.
Un site peut être pénalisé quand son contenu est copié
Un effet collatéral est que les sites dont le contenu est souvent copiés, ont été atteint par ce changement, Google étant souvent incapable de distinguer quel est l'original et quelle est la copie.
Normalement l'algorithme doit pénaliser les sites qui recopient le contenu d'autres sites. Mais il arrive souvent qu'il confonde l'original et la copie et que le premier soit pris pour la seconde.
Cela est arrivé même à des sites populaires comme cultofmac.com.
Un site peut être pénalisé pour une cause antérieure
Un site peut avoir perdu une part importante de son trafic au moment de la Panda Update pour une cause qui n'a rien à voir avec la qualité du contenu, ce qu'a confirmé Matt Cutts.
Le site avait déjà reçu un signal négatif, par exemple pour avoir placé des liens vers une ferme de lien et reçu un score négatif sans effet sur son trafic. L'effet survient le 11 avril quand ce score se voit combiné avec d'autres critères défavorables.
Panda n'est pas un changement de l'algorithme mais un programme différent
C'est un programme qui est lancé à intervalles réguliers et qui considère les sites sur un plan différent en essayant surtout de déterminer l'utilité des pages, leur intérêt pour l'utilisateur.
Mais Google a récemment (au SMX en juin 2014) déclaré qu'elle utilisait plus de 500 algorithmes pour le positionnement des pages, aussi la notion d'algorithme général perd de son sens.
Google a déposé deux brevets en rapport avec Panda
Le brevet 8,190,537 démandé le 31 octobre 2008 décrit comment, en se basant sur les caractéristiques d'un certain nombre de pages on peut en reconnaissant ces caractéristiques dans d'autres pages les classer avec les précédentes. C'est ce que fait Panda. En retrouvant les caractéristiques des sites sans contenu utiles dans un nouveau site on déduit que celui-ci n'a pas de contenu utile.
Ainsi si les pages d'un site ressemblent à celles de sites sans contenu utile il sera pénalisé même s'il offre un contenu utile.
Il va de soi que si toutes les pages d'un site sont faites sur le même modèle, celui-ci a plus de chances d'être touché par Panda.
Le brevet 8 682 962 déposé le 25 mars 2014 par le même ingénieur à l'origine de l'algo Panda décrit comment pour un groupe de ressource, on établit un score global qui modifie le score de l'algorithme principal.
Panda a réduit le spam mais pas amélioré les résultats
Panda a effectivement supprimé une partie du spam, seulement une partie, car on voit toujours les premiers résultats occupés par des pages commerciales ne correspondant pas forcément à ce que l'on recherche. Par exemple la requête "logiciel gratuit" aboutit souvent à "logiciel payant avec version d'essai gratuite".
En général, les résultats n'ont pas été améliorés et il est toujours difficile de trouver ce que l'on cherche lorsque cela ne se réduit pas à quelques mots-clés.
Beaucoup de petits sites ont été pénalisés alors qu'ils offrent un contenu unique. Cela a été en partie réparé avec la mise à jour du 20 mai 2014.
Les mythes
Mythe: Panda évalue la qualité d'un site selon son contenu
Ce mythe a été délibéremment entretenu par les communiquants de Google: Panda serait un algorithme qui pénalise les pages au contenu insuffisant ou sans intérêt. Cela implique que le moteur analyse les pages pour évaluer leur contenu, ce qui est totalement faux.
En fait, Panda compare le nombre de liens totalement indépendants vers les pages des sites avec le nombre de requêtes qui affichent ces pages, et définit un ratio. Plus le ratio est faible et plus le site est pénalisé. Cela est décrit par le brevet 8,682,892.
C'est un fait que la méthode favorise les sites qui ont plus de backlinks authentiques et pour les avoir, il faut un contenu original et intéressant. Mais cela cet effet indirect dépend aussi d'autres facteurs. On peut obtenir beaucoup de liens par une activité de promotion sur un contenu banal. C'est plus la popularité que la qualité qui est prise en compte.
Mythe : C'est un groupe d'employés de Google qui a défini la qualité d'un site
L'algorithme Panda analyserait un site en fonction de critères définis par un groupe d'employés à qui on a présenté un ensemble de sites et qui a décidé lesquels sont de qualité, lesquels n'en sont pas. Les sites seraint ensuite pénalisés quand ils s'écartent de cette norme préétablie, indépendamment de tout autre critère. Cette étude a effectivement conduit à définir une formule qui établit une vague corrélation entre un score et la qualité mais rien dans l'algo ne vise à analyser la qualité des pages.
Mythe: Un site est pénalisé parce qu'il affiche trop de publicités
Le nombre de publicités sur une page n'est pas pris en compte par l'algorithme du moteur de recherche. D'ailleurs le service Adsense de Google permet d'afficher 6 unités sur une même page.
Jamais Google ne pénalisera un site parce qu'il affiche trop de publicités... Matt Cutts a confirmé lors du PubCon 2011 que la publicité n'était pas un critère direct pour Panda.
Une page est pénalisée parce qu'elle a trop peu de contenu (peut-être une seule phrase) à coté d'un remplissage publicitaire presque exclusif. Il y a une différence entre 3 pubs qui couvrent 90% de la surface d'une page et 3 pubs qui couvrent 10% de sa surface.
Mythe: Panda est fait contre des fermes de contenu
Plusieurs besoins ont été combinés dans ce nouvel algorithme. Peut-être la firme est elle agacée par l'arrogance des entreprises comme Demand Media que l'on voyait trop souvent sur les média (et dont on n'entend plus parler depuis Panda), et la plaisanterie au sujet du yacht nommé Adsense, mais la mise à jour a un but plus général et à long terme.
Cela a touché 14% des sites en anglais, donc des millions de sites.
Il est probable que les fermes de contenu aient servi d'échantillonage car plusieurs version de Panda on été lancées jusqu'à ce qu'elle aient toutes été coulées.
Le futur des moteurs de recherche n'est pas compatible avec les pages sans contenu original. On peut s'attendre à ce que Google réduise les sources d'information, ou ne se substitue à elles.
Mythe: Un compte Gmail peut faire pénaliser un site
Si l'on publie une lettre d'information par Gmail et si un nombre important de ceux qui y ont souscrit n'ouvrent pas les messages quand ils sont reçus ou font un spam report, le site émetteur de la lettre d'information reçoit une pénalité dit le webmaster de lockergnome.com.
Il a supprimé les abonnement et fait avec succès une requête en reconsidération.
Mais cela est formellement démenti par Matt Cutts: une requête en reconsidération ne se limite pas à ce que dit le webmaster, elle peut annuler un pénalité sans rapport.
Cult Of Mac pandalisé parce que son site était copié, obtient l'entrée en liste blanche