Réaliser un audit de liens – étudier les backlinks d’un site 1


Madeline
Sur twitter

Madeline

Diplômée d'Audencia Nantes, j'ai commencé par faire des stages en communication web, puis web marketing avant de me plonger dans le SEO.

Je suis actuellement consultante SEO chez iProspect. J'ai ouvert ce blog pour partager des astuces, des tuto, ou des informations plus orientées techniques et opérationnelles.
Madeline
Sur twitter

Pour amorcer la rentrée, je publie un vieil article (de 2014) histoire de reprendre un douceur. Les outils ont peut être un peu changé mais l’idée est toujours valable. Puis en SEO, on ne réinvente pas la roue tous les jours non plus (mais on réactualise certaines choses).

Donc voici un vieux tutoriel qui n’avait pas eu de vie publique jusqu’à maintenant sur comment réaliser un audit de liens…ou plus exactement, comment traiter les données avec excel. Avec pas mal d’outils dedans pour devenir le petit des détectives des backlinks.

Objectifs d’un audit de liens :

  1. faire un suivi du netlinking
  2. regarder la stratégie de sites
  3. trouver de l’inspiration

Outils nécessaires :

  • une liste de liens (pour son propre site, on peut prendre les données de Google Webmaster Tools ou Majestic SEO, gratuit. Pour des sites concurrents, mieux vaut utiliser des licences payantes d’outil commme Ahrefs, MajesticSEO ou Opensiteexplorer)
  • excel
  • seo tools for excel (accessoire)

Dans ce tutoriel, je partirai d’un export de données de ahrefs. Ahrefs avait la bonne idée de faire des exports complets avec toutes les données (dont l’IP des sites), ce qui n’était pas le cas de de majestic…mais libre à chacun d’utiliser les outils qu’il veut, avec les infos dont il a besoin.

Attention, s’il y  a beaucoup de liens (plusieurs dizaines de milliers ou plus), Excel risque de ne pas être très rapide. Patience 🙂

Etape 1 : exporter la liste des backlinks

  • Aller sur ahrefs.
  • Indiquer un domaine
  • Aller dans Export>CSV
  • Télécharger tous les backlinks/ref pages

Enregistrer le fichier csv

Etape 2 : traiter les données dans excel

Ouvrir Excel (attention, je n’ai pas dit cliquer sur le fichier pour l’ouvrir avec excel, ouvrez juste une nouvelle feuille de calcul dans excel).

Aller dans Données, à partir du texte (1 et 2) (vous notez que ma feuille est bien vide)

Le fichier est délimité (1), vérifier l’encodage (2, ça évite d’avoir des problèmes avec les accents, etc.), puis cliquer sur suivant (3).

 

Sélectionner la virgule (1) comme séparateur, vérifier sur l’aperçu qu’il y a bien des colonnes (2), puis cliquer sur Terminer (3).

Préciser où vous souhaitez importer les données (à partir de la case A1, comme c’est indiqué par défaut, c’est très bien).

Voilà, votre fichier a pris forme.

Etape 3 : préparer son tableau

Que souhaitez-vous étudier ?

Selon l’outil utilisé pour faire l’export, il n’y a pas forcément toutes les données que l’on souhaite. On peut donc retravailler le tableau pour ajouter des colonnes qui nous semblent utile.

Exemples de colonne à ajouter :

  • Colonne G : Referring domain : =UrlProperty(D2; »domain »)
  • Colonne F : domaines distincts: =SI(NB.SI($E$2:E2;E2)=1;1;0)
  • Colonne H : TLD  =UrlProperty(D2; »tld »)
  • Colonne W : date  : =GAUCHE(W2;TROUVE(« T »;W2)-1) ou bien =RegexpFind(W2; »(.*)T(.*) »;1)

Dans la suite de ce tutoriel, mon fichier aura ces 4 nouvelles colonnes. Il en contiendra donc 27.

Enregistrer (ce serait bete de tout perdre, même si ce n’est pas très compliqué à refaire).

Sélectionner toutes les lignes et colonnes utilisées (pour le faire rapidement, vous pouvez utiliser les raccourcis excel, depuis la cellule A1,  CTRL + MAJ + droite  puis CTRL + MAJ + bas).

Créer un tableau croisé dynamique

(vous remarquerez que mes lignes et colonnes sont bien sélectionnée)

Etape 4 : manipuler le tableau croisé dynamique

Vous devriez arriver à ce résultat

Un tableau croisé dynamique, vous mettez dans Etiquettes de ligne les données que vous souhaitez dans les lignes, et dans Valeurs, vous mettrez ce que vous souhaitez comme colonne.

Voici quelques exemples de données intéressantes à étudier.

Les différentes sources de liens

Quels sont les domaines qui font le plus de liens ?

Ca permet de voir quels sont les partenaires du site, comment ont-ils obtenu des liens ? On peut également faire un tri croissant pour avoir des idées de liens qui restent peu exploitées. Mettez Referring domain dans Etiquettes de lignes, et Referring Page URL dans Valeurs (en glisser/déposer).

Pour mieux visualiser, il faut trier les données par nombre de referring URL décroissant.

Vous pouvez ajouter un graphique pour mieux vous représenter les données. Et s’il faut faire une synthèse écrite, c’est mieux d’illustrer ses propos par des données claires.

Quelles sont les extensions de domaine (tld) utilisées ?

  • Etiquettes de lignes : TLD
  • Valeur : domaines distincts ou referring page URL.
  • (puis tri décroissant sur les valeurs).

Est-ce cohérent avec le site ? un site français devrait avoir une majorité de liens en .fr et .com, et très peu de .cn, .ru, .edu, etc.

Si le schéma n’est pas cohérent avec le marché ciblé, on peut se demander si le site utilise une technique black hat, s’il est victime de nseo, ou quelle peut etre la raison de cette diversité.

Sur quelle IP y a-t-il le plus de liens ?

  • Etiquettes de lignes : IP From
  • Valeur : Referring Page URL;
  • Puis trier selon les referring page URL

Cela permet d’exclure quelques IP qui fausseraient les statistiques, dont les IP internes.

Sur quelle IP y a-t-il le plus de domaines ?

  • Etiquettes de lignes : IP From
  • Valeur : domaines distincts
  • Puis trier le selon les domaines distincts. 

Cela permet parfois de détecter des réseaux de sites (mal construits).

Quelle est la répartition par “autorité” des sites qui font des liens ?

  • Etiquettes de lignes : Domain Rank
  • Valeur : Domaines distincts

On peut faire la même chose pour les pages. On pourrait également ajouter une colonne page rank, et se baser sur le pagerank en lieu et place du domain rank de ahrefs.

Màj : sur ce sujet, Majestic apporte une réelle valeur ajoutée avec son topical Trust Flow. Il y a vraiment des pistes à étudier qui n’existaient pas en 2014.

Combien y a-t-il en moyenne de liens externes sur les pages qui dont des liens ?

  • Etiquettes de lignes : External Links Count
  • Valeur : referring page URL

Quels sont les types de sites qui font des liens ?

Il faudrait créer une autre colonne pour identifier les sites : annuaire, blog, institutionnel, etc.

Quelle a été la progression du linking ?

  • Etiquettes de lignes : Date
  • Valeur : referring page URL

Cela permet de mettre à jour les campagnes de liens : quand un site a-t-il commencé à acquérir des liens ? cette progression est-elle naturelle ? Y a-t-il des pics ?

Quelles pages bénéficient des liens ?

  • Etiquettes de lignes :Link URL
  • Valeur : referring page URL

Quelle est la proportion de liens qui pointent vers des pages profondes ?

Quel type de page obtient le plus de liens ?

Cela nécessite de catégoriser les pages et d’avoir une connaissance du site.

Il faudrait au préalable ajouter une colonnne “type de page” dans le fichier de base, et faire des conditions du type : si l’url contient actu, c’est une page d’actualité, si l’url contient rubrique, c’est une rubrique, si l’url a un ID de 6 chiffres, c’est une fiche produit, etc. etc.

Quelles ancres ?

  • Etiquettes de ligne : anchor
  • Valeur : refering page URL

Les liens sont-ils optimisés ? Attention aux pingouins.

Outil complémentaire pour détecter les réseaux de sites :

Pour mieux détecter les réseaux de liens utilisés par des sites, vous pouvez utiliser netcomber… cet outil était vraiment top mais en 2017, il semble qu’il n’est plus disponible. C’est dommage car c’était impressionnant de voir les footprints que pouvaient laisser les sites.

Si vous avez l’âme d’un détective, vous pouvez essayer de trouver qui est à la source de ce réseau, soit en passant par la version payante de netcomber, soit en faisant des requêtes sur d’autres outils comme spyonweb (http://spyonweb.com/)

Enfin, il y a d’autres façons de détecter les réseaux de site en fouillant un peu (whois,… des idées chez renard du dezert)

Enfin maintenant, il y a des outils très bien à disposition, comme SEObserver : https://www.seobserver.com/. Kevin a fait de nombreuses présentations sur le sujet. Allez, une au hasard (qui date aussi un peu…mais comme au début de cet article, ce n’est pas toujours utile de réinventer la roue) :


Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Commentaire sur “Réaliser un audit de liens – étudier les backlinks d’un site

  • Regis

    très bon article, je partage !
    Bon, je m’arrête pas là sinon je vais passer en spam… Je dirais que la méthode n’a pas beaucoup vieilli, tu as bien fait de partager l’article. Puis cela peut aussi s’appliquer à une sorte d’étude de mots clefs automatisée, selon les niveaux de concurrence et volumes donnés par ahref par exemple.
    au plaisir de se croiser.