Fermer

avril 16, 2020

Les liens sont-ils toujours importants pour le référencement en 2020?


Voici les résultats de la cinquième de nos études «Liens en tant que facteur de classement». Nous avons mené la première de ces études en mai 2016 et suivons le même ensemble de requêtes au fil du temps pour mesurer tout changement important dans le rôle des liens. Dans l'étude de cette année, nous avons également élargi notre examen des différents secteurs du marché pour voir comment le rôle des liens peut varier selon le secteur du marché.

Nous avons également augmenté le nombre de requêtes que nous examinons au fil du temps. Nous l'avons fait pour nous assurer que nous disposions de suffisamment de données pour que les analyses du secteur du marché soient significatives. La répartition du mois pour chacune de nos études et le nombre de requêtes examinées par étude sont les suivants:

  • Mai 2016 – 6 000 requêtes
  • Août 2016 – 16 000 requêtes
  • Mai 2017 – 16 000 requêtes
  • Août 2018 – 27 000 requêtes
  • Décembre 2019 – 32 000 requêtes

Chacun des ensembles de données de requête inclut les ensembles de requêtes d'origine des études précédentes, nous allons donc également montrer une comparaison de pommes à pommes de ces résultats. comme les résultats à plus grande échelle de notre dernière étude, dans laquelle les données ont été extraites en décembre 2019. En prime, pour la deuxième année consécutive, nous commenterons également l'augmentation du nombre de liens fournis, et la qualité des métriques DA / PA, de Moz Link Explorer.

Les résultats

Comme pour nos études précédentes, nous avons reçu le soutien gracieux de Moz, qui nous a permis d'accéder à Link Explorer pour extraire les données pour notre étude. Veuillez noter que l'équipe Moz ne nous a pas demandé de faire cette étude, ils ne nous ont pas payés, ni même nous ont demandé de noter la précision de leur outil ou de ses métriques. Il n'y a pas de contrepartie – nous avons choisi de le faire nous-mêmes.

Cela dit, nos données montrent que la taille de l'index de liens Link Explorer continue de croître considérablement:

 Croissance de l'index Link Explorer

Nombre de liens vers une page en tant que facteur de classement

Pour l'étude des liens elle-même, le premier ensemble de graphiques que nous examinerons est basé sur le nombre total de liens pointant vers la page de classement. Pour ceux-ci, nous avons calculé le score de corrélation quadratique moyenne. Descendez à la section méthodologie pour voir ce que signifie réellement une valeur de «Score de corrélation quadratique moyen de Spearman». Voici un aperçu de ces données pour les requêtes 6K dans les quatre instances de l'étude que nous avons exécutée à ce jour:

 Liens en tant que facteur de classement pour les requêtes 6k sur cinq ans
Notez que les mêmes 6000 requêtes pour ce graphique ont été utilisés dans les cinq ensembles de données. Ces données montrent une certaine baisse au fil du temps, en particulier au cours de la dernière année. Cependant, comme indiqué ci-dessous, il y a des raisons de croire que la mesure des liens par Google en tant que facteur de classement évolue.

À partir de la deuxième étude, nous avons augmenté le nombre de requêtes à 16 000 requêtes. Nous avons effectué ce même ensemble de 16 000 requêtes jusqu'à l'édition de cette année de l'étude. Voici les scores de corrélation pour les quatre ensembles de données de 16 000 requêtes:

 Liens comme facteur de classement pour 16 000 requêtes sur quatre ans

Encore une fois, nous constatons ici une baisse du poids des liens dans la dernière version de notre étude.

Avec la quatrième de nos études, nous avons augmenté le nombre de requêtes à 27K résultats. Nous l'avons fait pour effectuer une segmentation supplémentaire des données (plus à ce sujet dans un peu). Voici ce que nous voyons dans les ensembles de données de 2018 et 2019 (les deux dernières années):

 Liens en tant que facteur de classement pour 27 000 requêtes sur deux ans

Enfin, nous avons augmenté le nombre de requêtes à 32K dans les données que nous avons tirées en décembre 2019. La raison de cette dernière expansion est que, bien que nous ayons effectué une segmentation des données dans l'ensemble de données 2018 (dans l'étude que nous avons publiée au début de 2019), nous avons pensé que nous pourrions utiliser plus requêtes pour rendre ces segments plus robustes. Voici nos résultats:

 Liens en tant que facteur de classement pour les requêtes 32K fin 2019

L'une des constatations les plus notables que nous avons vues dans l'étude de l'année dernière était que, pour la première fois, le Moz DA et Moz PA étaient de meilleurs prédicteurs du classement que le nombre total de liens. Cette fois encore, nous avons testé cela:

 Liens en tant que facteur de classement pour les requêtes 32K fin 2019

Comme nous l'avons vu l'année dernière, DA et PA sont tous deux de meilleurs prédicteurs de la position de classement que le nombre total de liens. L'autorité de domaine (DA) semble être la meilleure mesure. Cela suggère que l '«autorité» du site fournissant un lien est très importante.

Liens vers une page en tant que facteur de classement par type de requête

Comme dans les études précédentes, nous avons comparé la corrélation totale des liens pour les requêtes commerciales et informationnelles. . Cependant, en analysant nos données de décembre 2019, nous avons également montré que la DA et la PA étaient également réparties dans ces catégories.

 Liens vers un contenu commercial contre informationnel

Liens vers une page en tant que facteur de classement par segments de marché

Nous avons également évalué comment les liens pouvaient varier en tant que facteur de classement d'un segment de marché à l'autre. Dans cette première vue, regardons cela pour les requêtes commerciales, divisées en médical, financier, technologie et leurs segments:

 Liens en tant que facteur de classement Requêtes commerciales segmentées par marché

Ces données montrent que les liens sont un facteur de classement plus important pour les requêtes financières que pour les autres types de requêtes. Avant de tirer une conclusion finale pour cela, regardons également une analyse sectorielle pour les requêtes d'information:

 Liens en tant que facteur de classement Requêtes d'information segmentées par marché

Ici, nous voyons le même type de plus élevé score pour les requêtes financières par rapport aux requêtes médicales ou technologiques.

Liens en tant que facteur de classement agrégé par le nombre de liens normalisés

À partir de la première étude, nous avons également agrégé le nombre de liens normalisés (voir la section méthodologique ci-dessous pour une explication de ce que c'est) par position de classement.

La raison pour laquelle ce point de vue est important est que la pertinence et la qualité sont des facteurs de classement considérables, comme ils devraient l'être. En outre, il existe de nombreux autres facteurs tels que le besoin de Google de montrer la diversité dans les SERPs (voir la section intitulée «Comment les principaux facteurs de classement de Google interagissent-ils?» pour plus de détails à ce sujet). Dans l'analyse des liens agrégés, nous obtenons une vue résumée de l'impact des liens répartis sur un large éventail de résultats de recherche.

Voici ce que nous avons vu en regardant l'ensemble de requêtes 6K dans les cinq études:

 MarketLinks comme facteur de classement par position de classement - requêtes 6K

Voici les données pour la requête 16K définie dans les quatre dernières études:

 Liens en tant que fa fa de classement par position de classement 16k requêtes

Voici les données de l'ensemble de requêtes 27K des deux dernières études:

 Liens en tant que facteur de classement par position de classement - requêtes 27K
Enfin, voici l'ensemble de requêtes 32K pour la dernière étude: [19659046] Liens en tant que facteur de classement par position de classement – 32 000 requêtes  » width= »600″ height= »366″ data-recalc-dims= »1″/>

En résumé, notre vue agrégée montre une corrélation très puissante entre les liens et la position de classement.

Comment les principaux facteurs de classement de Google interagissent-ils?

Il y a de nombreuses raisons de vouloir comprendre d ceci; cependant, concernant les liens comme facteur de classement, ils peuvent nous aider à comprendre pourquoi les scores de corrélation de Spearman non agrégés ne sont pas plus élevés.

Il y a deux raisons principales à cela:

1. La pertinence et la qualité du contenu sont des facteurs importants

Dans sa forme la plus simple, si une page Web n'est pas pertinente pour une requête, elle ne doit pas être classée. C'est évident, bien sûr, mais la discussion est beaucoup plus nuancée que cela. Pour illustrer cela, supposons que nous ayons dix éléments de contenu suffisamment pertinents pour être pris en compte pour le classement d'une requête. Supposons en outre qu'ils ont des «scores de pertinence» (RS) comme celui-ci:
 Classement basé sur le score de pertinence

Cela semble être un assez bon algorithme de classement à la surface. Nous classons le contenu le plus pertinent en tête. Vous remarquerez également que les scores de pertinence sont définis dans une plage très étroite, ce qui est logique. En bref, si vous n'êtes pas pertinent, vous ne devriez pas classer, quel que soit le nombre de liens pointant vers votre page ou votre site.

Le problème est qu'il est facile de rendre les éléments de contenu très pertinents en remplissant le bon des mots, et le contenu le plus pertinent peut, en fait, donner des informations très médiocres aux utilisateurs. Alors, ajoutons un nouveau score appelé score de qualité (QS) – pas la version AdWords de ce terme, mais plutôt une évaluation organique réelle de la qualité d'une page) – et voyons comment cela affecte notre algorithme:

 Basé sur le classement sur la pertinence et les scores de qualité
Cela semble être une amélioration, et c'est probablement le cas. Le problème est que, comme pour mesurer la pertinence, mesurer la qualité est une chose difficile à faire. Ajoutons un élément de plus au mixage, un Link Score (LS), et tirons-en parti pour que le «marché dans son ensemble» nous donne une indication du contenu le mieux adapté à ce sujet. Voici à quoi cela ressemble:
 Classement basé sur la pertinence, la qualité et les liens

Remarquez comment le classement a changé entre les trois scénarios? Et à peu près à cela. Dans cette simple maquette de l'algorithme de Google, il est assez clair que les liens sont essentiels. Vous voulez connaître la corrélation de Spearman pour les liens comme facteur de classement dans le troisième scénario présenté? C'est 0,28. Il s'agit d'une simplification majeure de l'algorithme de Google, mais même sur cette base, vous pouvez voir pourquoi des scores très élevés de Spearman sont difficiles à atteindre.

2. Des algorithmes supplémentaires entrent en jeu:

  • Résultats de la recherche locale
  • Résultats de l'image
  • Résultats vidéo
  • La requête mérite les résultats de la diversité

Ces résultats peuvent affecter 15% de nos résultats. Pour illustrer cela, imaginons que nous prenons notre exemple ci-dessus et utilisons Query Deserves Diversity pour modifier uniquement l'un des postes de classement. Un résultat ayant un score élevé est remplacé par un seul élément (résultat numéro 3).

 Algorithmes de classement avec un facteur de classement aléatoire

Dans notre exemple, nous avons remplacé le troisième résultat par quelque chose qui est venu d'un algorithme différent (tel que Query Deserves Diversity). Devinez ce que cela fait au score de Spearman pour les liens comme facteur de classement pour ce résultat? Il tombe à 0,03.

J'espère que cela vous donnera une idée de pourquoi un score dans la plage de 0,3 indique que les liens sont un facteur très important dans le classement.

Même dans cette simple maquette de l'algorithme de Google, c'est clair que les liens sont essentiels.

Progrès de Google dans la lutte contre le spam de liens

Ceux qui disent que les liens sont sur le déclin comme facteur de classement soulignent souvent les efforts des spammeurs pour utiliser des pratiques illégitimes pour acquérir des liens et gagner des classements que leurs sites ne font pas ne méritent pas. Ce fut un énorme problème pour Google entre 2002 et 2013. Cependant, la marée dans cette bataille a commencé à tourner en 2012.

Ce qui s'est produit en premier, c'est que Google a commencé à imposer une vague de sanctions manuelles. Cela seul a envoyé des ondes de choc à travers l'industrie du référencement. La prochaine étape importante a été la sortie de la première version de Penguin le 24 avril 2012, ce qui a été un grand pas en avant pour Google. de Penguin et des sanctions manuelles pour affiner son approche face aux personnes qui utilisent des méthodes illégitimes pour obtenir des liens. Cela a culminé avec la sortie de Penguin 4.0 le 23 septembre 2016 .

Avec la sortie de Penguin 4.0, la confiance de Google dans son approche des liens était devenue si élevée que l'algorithme Penguin n'était plus un site de punition. pour obtenir de mauvais liens. À partir de Penguin 4.0, l'algorithme identifie simplement les liens qu'il considère comme mauvais et les ignore (les amène à ne pas avoir de valeur de classement).

Ce passage de pénaliser les sites avec de mauvais liens à simplement actualiser ces liens reflète la confiance de Google que Penguin trouve un pourcentage considérable des mauvais liens qu'il est conçu pour détecter. Bien sûr, ils utilisent toujours des sanctions manuelles pour lutter contre les types de pratiques illégitimes de création de liens que les gens utilisent et que Penguin n'a pas pour but de résoudre. Je me souviens encore du panel Black Hat / White Hat sur lequel j'ai siégé en décembre 2008 à SES Chicago. Les autres panélistes étaient Dave Naylor, Todd Friesen et Doug Heil. Quelques membres du panel ont fait valoir que l'achat de liens au début de la campagne pour un site Web était une exigence et qu'il était irresponsable de la part d'un pro du référencement de ne pas le faire.

Comment une décennie change les choses! Cela fait de nombreuses années que tout référencement dans n'importe quel site a fait valoir que l'achat de liens est une pratique intelligente. En fait, vous ne pouvez trouver personne faisant des recommandations publiques sur les méthodes d'obtention de liens qui enfreignent les consignes aux webmasters de Google. L'ensemble de l'industrie pour ce genre de choses a été enfoui. Être conduit sous terre n'est pas la même chose qu'être parti, mais cela montre que la capacité de Google à trouver et à détecter des problèmes est devenue assez efficace.

Voici un dernier point, et il est important. Pourquoi Google a-t-il l'algorithme Penguin et pourquoi évalue-t-il les pénalités de liaison manuelle? La réponse est simple: parce que les liens sont un facteur de classement important, et les plans pour obtenir des liens qui ne correspondent pas à ses directives sont des choses que Google veut aborder de manière proactive. Sinon, il n'aurait pas besoin d'investir dans la lutte contre le spam de liens.

Pourquoi les liens sont-ils un signal précieux?

Pourquoi Google utilise-t-il toujours des liens? Pourquoi ne pas simplement passer aux signaux d'engagement des utilisateurs et aux signaux des médias sociaux? Nous n'entrerons pas dans les détails de la raison pour laquelle ces signaux sont problématiques ici, mais partagerons de brefs points sur chacun d'eux:

  1. Signaux des médias sociaux: Deux raisons principales: (1) Google ne peut pas dépendre des signaux de des plateformes tierces gérées par ses concurrents (Google et Facebook ne sont pas amis); (2) Les principaux sites de médias sociaux tels que Facebook et LinkedIn ont cessé de partager des données sur les likes et les partages – si les sites de médias sociaux eux-mêmes ne trouvent pas ces signaux précieux, pourquoi un moteur de recherche devrait-il?
  2. Signaux d'engagement des utilisateurs : Google trouve probablement un moyen d'utiliser ces signaux dans un scénario ou un autre, mais il y a des limites à ce qu'il peut faire. Voici ce que le chef de l'équipe d'apprentissage automatique de Google, Jeff Dean, a déclaré à leur sujet: "Un exemple d'un problème d'apprentissage par renforcement plus compliqué est peut-être d'essayer de l'utiliser dans les résultats de recherche que nous devrions montrer. Il existe un ensemble beaucoup plus large de résultats de recherche que nous pouvons afficher en réponse à différentes requêtes, et le signal de récompense est un peu bruyant. Si un utilisateur regarde un résultat de recherche et l'aime ou ne l'aime pas, ce n'est pas si évident. "

Maintenant, allons au cœur du problème: pourquoi les liens sont-ils un si bon signal? Cela se résume à trois points principaux:

  1. La mise en œuvre des liens nécessite un investissement matériel de votre part. Vous devez posséder un site Web et prendre le temps de mettre en œuvre le lien sur une page Web. Ce n'est peut-être pas un investissement énorme, mais cela demande plus d'efforts que la mise en place d'un lien dans une publication sur les réseaux sociaux.
  2. Lorsque vous implémentez un lien, vous faites une approbation publique identifiant votre marque avec la page Web vers laquelle vous " re liaison. De plus, c'est statique. Il s'y trouve de manière durable. En revanche, avec un lien dans une publication sur les réseaux sociaux, il disparaît rapidement des flux des utilisateurs, souvent en quelques minutes.
  3. Maintenant, voici le gros: lorsque vous implémentez un lien sur une page de votre site, les gens peuvent cliquer dessus. et quittez votre site. En fait, vous les invitez à le faire.


Réfléchissez un instant à ce dernier point. Un lien (non publicitaire) sur votre site est une indication de votre part (en tant qu'éditeur de la page avec les liens) que vous pensez que le lien a suffisamment de valeur pour vos visiteurs et fera suffisamment pour améliorer votre relation avec eux, que vous êtes prêt à laisser des gens quitter votre site.

C'est ce qui fait des liens un signal extrêmement précieux.

Méthodologie de base

Après avoir consulté quelques experts ( Paul Berger et Per Enge , anciennement de l'Université de Stanford) sur la meilleure approche, nous avons effectué un calcul de la corrélation de Spearman sur les résultats de toutes les requêtes de notre étude, puis pris la moyenne quadratique de ces scores. La raison en est qu'il exploite le carré des variables de corrélation (où la valeur de corrélation est R, la moyenne quadratique utilise R au carré).

C'est en fait la valeur R au carré qui a une certaine signification dans les statistiques. Par exemple, si R est 0,8, alors R au carré est 0,64. Vous pouvez dire que 64% de la variabilité de Y est expliquée par X. Comme Paul Berger l'a expliqué, il n'y a pas de phrase significative impliquant la variable de corrélation R; cependant, R au carré vous donne quelque chose d'utile à dire sur la relation corrélée.

Voici un aperçu du fonctionnement de ce processus de calcul:

 Formules de calcul quadratiques moyennes

En plus des différents calculs approche, nous avons également utilisé un mélange de différents types de requêtes. Nous avons testé les termes principaux commerciaux, les termes commerciaux à longue traîne et même les requêtes d'informations. En fait, les deux tiers de nos requêtes étaient de nature informative.

Approches supplémentaires

Les approches de la moyenne des corrélations individuelles et de la moyenne quadratique sont valides; cependant, une limite de ces approches est que d'autres facteurs peuvent dominer l'algorithme de classement et rendre difficile la visibilité de la force du signal.

Pour cette raison, nous avons choisi d'adopter également d'autres approches de l'analyse. Le premier était de mesurer les liens de manière plus agrégée. Pour ce faire, nous avons normalisé la quantité de liens pour chaque résultat. Nous avons pris le nombre de liens pour chaque position de classement pour une requête donnée et l'avons divisé par le plus grand nombre de liens pour cette requête donnée.

Par conséquent, le score de lien le plus élevé pour chaque requête aurait un poids de «1». La raison pour cela est d'empêcher que quelques requêtes qui ont des résultats avec un grand nombre de liens aient une influence excessive sur les calculs résultants.

Nous avons ensuite pris le total des liens pour tous les résultats de recherche par chaque position de classement . Les équations pour cela ressemblent plus à ceci:

 Liens totaux par calcul de position SERP
La valeur de ceci est qu'elle atténue l'impact des corrélations négatives d'une manière différente. Considérez-le comme un lissage de l'impact d'autres facteurs de classement, comme illustré ci-dessus (score de pertinence, score de contenu et impact d'autres algorithmes). C'est le calcul qui est indiqué dans les données "Corrélation de lien agrégé par position de classement" ci-dessus.

Nous avons également examiné cette autre façon. Dans cette vue, nous avons continué à utiliser les totaux normalisés des liens, mais nous les avons regroupés dans des groupes de classement de 10. Autrement dit, nous avons résumé les totaux de liens normalisés pour les 10 premiers, nous avons fait de même pour le classement des positions 11 à 20, 21 30, et ainsi de suite. Nous avons ensuite calculé les corrélations pour voir à quoi elles ressemblaient en termes de ce qu'il faudrait pour classer dans chaque bloc de 10 positions. Ces calculs ressemblaient plus à ceci:

 Liens totaux par bloc de 10 SERPs

Cela nous donne une approche un peu plus granulaire que de simplement agréger toutes les positions de classement dans les positions SERP, tout en lissant certaines des limites de la méthode de la moyenne des corrélations individuelles. C'est ce qui est montré dans les données ci-dessus «Corrélation de lien agrégé en blocs de 10".




Source link