Comprendre l'algorithme Panda
La modification du classement des pages par Google du 24 février 2011, qui prend le nom de l'ingénieur qui l'a dirigée, a impactée 11,8% des sites aux USA en réduisant la présence dans les résultats de pages au contenu jugé pauvre, non original ou peu utile.
Les sites en français ont été impacté en août 2011.
"Nous voulons encourager un écosystème sain..." dit Google.
Les critiques que la firme a subie - on se souvient de la blague du premier avril sur le Yacht nommé Adsense du CEO de Demand Media - faisaient du tort au moteur de recherche et il devait réagir.
Panda était un programme lancé manuellement de temps en temps par Google pour évaluer la "qualité" des sites qui a ensuite été intégré à l'algorithme organique en janvier 2012.
Il calcule un facteur de modification pour un site afin d'altérer le classement initial des pages basé sur les autres critères.
Aucun autre critère de l'algorithme ne tempère ce score.
Comment l'algorithme Panda modifie les résultats
Théoriquement, Panda fait la différence entre un site de qualité et un site sans intérêt ainsi:
L'algorithme recherche les sites d'autorité: ils offrent fréquemment une information nouvelle et des contenus innovants, au contraire de ceux qui machouillent cinq cent mots sur un sujet dans lequel on n'a pas de connaissances particulières.
Une autre citation plus récente:
Déclasser les sites de mauvaise qualité qui ne fournissent pas un contenu original ou autrement ne lui ajoutent aucune valeur.
Cette sentence est auto-descriptive. C'est elle qui dit ce qu'est un site de mauvaise qualité. Mais les webmasters recherchent des critères plus précis.
Voici comment Google détermine la qualité supposée des sites, en se basant sur le brevet 8,682,892:
- Panda consiste à décompter les liens vers un site provenant de sources indépendantes entre elles et avec le site, décompter les requêtes de visiteurs différents (sur une période ou sans limitation de temps selon les cas) vers les pages du site. Un ratio entre les deux décomptes est calculé, cela donne la formule suivante: M = IL / RQ.
Et ce ratio sert à multiplier le score de positionnenent antérieur de chaque page avant de la classer et la présenter dans les résultats.
M = facteur de modification du score initial,
IL (inbound links) est le nombre de backlinks indépendants,
RQ (ressources queries) est le nombre de requêtes amenant les pages du site dans les résultats.
(Ref: USPTO 8,682,892). - Panda pénalise les sites dont le trafic provient en majorité des moteurs de recherche. Qui n'ont pas de backlinks.
- Un contenu peu original - même un article entièrement différent mais reprenant les mêmes idées (mots-clés en fait) - est pénalisé car il obtient peu de liens.
- Un contenu peu utile ou superficiel n'attire pas les liens retour non plus.
- Un contenu mal écrit de même.
- Le design d'un site n'est pas pris en compte directement par l'algorithme mais il peut influer sur les liens.
- Le fait que de nombreux utilisateurs bloquent un site dans les résultats de recherche, est pris en compte comme signal négatif par Panda depuis la seconde itération du mois d'avril 2011. Cela est officiel. (Mais Google s'efforce de séparer le spam de l'authentique). Cela a été ajouté à la méthode originale décrite dans le brevet.
- Des pages de catégories ou étiquettes, de liste de pages, ce n'est pas nouveau, mais maintenant le site est pénalisé dans son entier.
- Un facteur de modification global est affecté au site. Si une partie d'un site est affectée par ces critères, la note globale du site en pâtira, toutes les pages seront déclassées.
- Un groupe peut englober plusieurs sites du même webmaster: le score est modifié dans son ensemble.
- Les pages pénalisées seront moins souvent visitées par les robots de moteurs de recherche (dixit Matt Cutts). On peut donc en consultant les logs vérifier que cette méthode a été appliquée.
Panda a été originellement conçu comme un programme séparé car il demande de vastes ressources pour partitionner le Web en groupe de ressources et pour les comparer.
Avec Panda, Google à voulu changer radicalement le rôle même du moteur de recherche: il ne veut plus que les résultats puissent contribuer à la promotion et au succès d'un site, dorénavant, un site doit obtenir son audience ailleurs, à partir des liens qu'il reçoit et s'il obtient un certain succès, alors seulement le moteur peut le mettre en avant, en fonction d'autres critères de classement.
Le discours qui a été tenu sur la qualité est fallacieux: il s'agit surtout de popularité, car les sites populaires obtiennent toujours de nombreux liens, quoiqu'ils publient, souvent des infos venant d'autres sites. La lecture du brevet montre aussi que Google fait peu de cas de l'originalité: un contenu entièrement copié peut être mieux positionné que l'original s'il obtient plus de liens indépendants.
Comment modifier un site pour Panda
Que faire quand on a été touché par la Panda Update?
Selon Google:
"Un contenu de pauvre qualité sur une partie du site peut affecter le classement global du site, donc supprimer les pages de pauvre qualité, les combiner ou améliorer le contenu de pages individuelles superficielles pour en faire des pages utiles, ou déplacer les pages de pauvre qualité sur un domaine différent pourrait éventuellement aider au classement de votre contenu de plus grande qualité."
Cependant tous les experts s'accordent à dire qu'il n'est pas possible d'annuler la pénalité sans changer les contenus des pages existantes et ajouter un nouveau contenu.
Fusionner deux pages au contenu banal fera une nouvelle page plus grande au contenu banal, cela ne résoudra rien.
L'effort du Webmaster doit être concentré sur l'obtention de liens retour indépendants.
- Idéalement un site maximise la formule Panda s'il a beaucoup de backlinks et aucun contenu. Un service peut correspondre à cela. Mais Panda n'est qu'un facteur qui amplifie le score initial, celui-ci dépend du contenu.
- Pour les pages dont le moteur ne peut pas comprendre l'intérêt pour l'utilisateur, enrichir leur contenu. Mais si elles ont de nombreux liens retour, changer le contenu peut engendrer d'autres pénalités (à moins que cela ne leur apporte de nouveaux liens retour) .
- Supprimer toutes les pages qui n'ont pas de lien retour est assurément un moyen efficace d'améliorer son ratio et donc retourner en grâce. Ou à défaut les sortir de l'index avec une balise meta noindex.
- Pour obtenir des backlinks, assurez vous que votre contenu apporte quelque chose d'utile, donc d'inédit (rechercher le contenu similaire sur les moteurs). Demandez vous toujours ce que votre page apporte de plus.
- Personnalisez le contenu. Utilisez vos propres mots. Et, je m'adresse aux blogueurs, rappelez-vous vos dissertations, le professeur ne vous demandait pas de recopier le sujet, ni la réponse de quelqu'un d'autre, mais de donner vos propres idées. Prenez en compte des points de vue différents pour faire autorité et ne pas apparaitre subjectif.
- Préoccupez vous de l'expérience de l'utilisateur, l'envie de consulter plus de pages ou de revenir sur le site.
- Pour les pages qui n'ont aucune chance de recevoir des backlinks, ni de bien figurer dans les SERPs, rendez-les dynamiques et donc invisibles aux moteurs tout en répondant aux questions des visiteurs. C'est ce que nous faisons avec le dictionnaire (bouton en haut de page à droite), grâce à l'emploi d'Ajax.
- Regardez le taux de sortie dans Analytics ou autre outil statistique. Les pages qui ont un taux de sortie élevé pénalisent le site. On peut les supprimer ou les rendre dynamiques si elles n'ont aucun backlink.
- Encore, ne modifiez pas les pages qui ont de nombreux backlinks.
Il faut savoir que changer le contenu existant ne suffira pas à annuler les effets de Panda parce qu'il n'aura pas de nouveau backlinks. C'est surtout un nouveau contenu unique qui pourra le faire.
Tout cela demandera beaucoup de travail, mais on se consolera en pensant aux fermes de contenu qui ont dix millions de pages à modifier...
Conclusion
Le fait nouveau le plus important et qui rend d'ailleurs le résultats incompréhensibles aux webmasters, qui a été confirmé officiellement par Google, est que si une partie d'un site est pénalisée, l'ensemble du site sera pénalisé. Donc des pages de très bonne qualité seront moins bien positionnées dans les SERPs que des pages d'autres sites, de qualité inférieure!
C'est encore plus difficile à admettre depuis que l'on sait que, même si Google présente son procédé comme un moyen de sélectionner les pages de qualité, son effet principal est de favoriser les sites déjà plus importants et augmenter encore leur audience.
Voir aussi
- Le brevet Panda en clair. Description de la méthode.
- Panda Update, faits et mythes. Liste des idées fausses, souvent répandues.
- Discussion sur ce sujet sur le forum Google (anglais). Ce fil de discussion montre les réactions effarées de webmaster de sites anciens qui ont toujours suivi les guidelines de Google, mais on vu leur audience réduite à néant.