Script PHP: Carte de site avec le nombre de liens retours
Sur la base d'un fichier CSV des GWT, et du contenu de votre site, établit une carte du site hiérarchique avec le nombre de backlinks pour chaque page.
La valeur qui est prise en compte est la seconde valeur du tableau fourni dans les Google Webmaster Tools: le nombre de liens venant de sites différents.
Le tableau récapitulatif que le script produit, sous forme de fichier HTML, permet alors de juger de la popularité des différents types de pages sur le site, selon le nombre de liens qu'elles reçoivent.
Prérequis:
- Dans la configuration actuelle, le script requiert une image locale d'un site, à moins qu'on ne fasse tourner le script sur le serveur, dans ce cas il requiert seulement que le site soit statique, autrement dit que les pages soient stockées comme fichiers HTML.
- Alternativement, une carte de site au format standard XML.
- L'interpréteur PHP doit être installé.
- Télécharger la liste des liens retour sur de votre compte GWT, au format CSV.
Le script en lui-même ne requiert aucune installation. Une fois extrait de l'archive, pour créer une carte il démarre avec la commande:
php backcount.php
Si on dispose d'un fichier de carte de site, la commande est:
php backmap.php
Mais il faut créer un fichier backcount.ini pour entrer les informations concernant votre site, cela sur deux lignes:
site=c:/example.com map:sitemap.xml csv=www-example-com_20140530_ExternalLinks_LinkedPages.csv
La première ligne indique la racine de l'espace de stockage des pages. La seconde le chemin local de la carte de site. Ces deux commandes sont alternatives, backcount utilise seulement site et backmap utilise map.
La troisième est le chemin et le nom du fichier csv. Vous pouvez ajouter plusieurs lignes cvs pour comparer l'évolution dans le temps.
Si vous avez plusieurs sites à gérer, vous pouvez créer un fichier ini pour chacun.
Lorsque le programme est lancé, il vous demande le nom du fichier ini. Vous pouvez alors entrer le nom ou presser directement Enter si vous utilisez le fichier par défaut, backcount.ini.
Vous pouvez omettre l'extension .ini, le programme la rajoutera pour vous.
La programme génère ensuite un tableau HTML dans un fichier dont le nom reprend la première partir du nom du fichier CSV. Les répertoires de votre site sont en caractères gras, et sont suivis par la liste des fichiers qu'ils contiennent. Sur chaque ligne se trouve à droite le nombre de liens retours.
La lecture de ce tableau vous indiquera clairement quelle partie du site est la plus populaire, et laquelle n'intéresse personne, cela beaucoup plus facilement qu'avec la liste originale classée sur le nombre de backlinks et qui n'indique pas les pages sans aucun lien retour.
Celles-ci peuvent éventuellement être désindexées pour améliorer le classement de votre site dans les résultats de recherche... voir pourquoi dans L'algorithme Panda en clair.
Usage simplifié
Dans la dernière version du script d'août 2015, il n'est plus nécessaire de donner la liste des fichiers CSV pourvu qu'ils soient placés dans le même répertoire que le script backcount.php.
Il suffit d'indiquer le préfixe commun aux fichiers CSV dans le fichier ini. Par exemple si votre site est www.example.com, le préfixe commun sera: www-example-com:
site=c:/example.com prefix=www-example-com
Procédez ensuite comme dans le cas précédent.
L'archive backcount.zip contient le code source en langage Scriptol et le code exécutable en PHP.
Versions
- 21 août 2015. Nouvelle version simplifiée basée sur le préfixe commun. Le nom du fichier HTML produit est maintenant composé du préfixe et de la date complète
- 20 mai 2015. Mise à jour pour fonctionner avec les dernières versions de PHP.
- 9 novembre 2014. Les liens sur les répertoires n'étaient pas comptés. C'est corrigé.
- 23 octobre 2014. Adapté le code source pour Scriptol 2. Support de CSV multiples avec calcul de différence. Affiche le nombre total de backlinks dans la page HTML et dans la console.
- Juin 2014. Première version.
Le format CSV est souvent utilisé pour produire des listes échangeables entre logiciels différents. Le script ci-dessus utilise des fonctions simples parce qu'il est limité à un fichier bien défini, mais si vous désirez utiliser ce format dans vos programmes avec des fichiers d'origines différentes, des outils spécialisés pourront être utiles:
- CSVfix. Permet de classer alphabétiquement une liste, de faire des recherches, de convertir en XML ou SQL, de comparer deux fichiers CSV. Un programme binaire exécutable est disponible pour Windows ou Linux.
- Csvkit. Effectue le même genre d'opération. Ecrit en Python.
- OpenRefine. Contrairement aux précédents qui fonctionnent en ligne de commande, dispose d'une interface graphique. Cependant il fonctionne mal sur de gros fichiers.