Fermer

septembre 30, 2020

Page Authority 2.0: une mise à jour sur les tests et le calendrier


Publié par rjonesx.

L'une des décisions les plus difficiles à prendre dans n'importe quel domaine est de choisir consciemment de manquer une date limite. Au cours des derniers mois, une équipe d’ingénieurs, de data scientists, de chefs de projet, de rédacteurs en chef et de spécialistes du marketing parmi les plus brillants a travaillé à une date de sortie de la nouvelle autorité de page (PA) le 30 septembre 2020 Le nouveau modèle est exceptionnel à presque tous les égards par rapport à l'AP actuelle, mais notre dernière mesure de contrôle qualité a révélé une anomalie que nous ne pouvions ignorer.

En conséquence, nous avons pris la décision difficile de retarder le lancement de Page Authority 2.0 . Alors, permettez-moi de prendre un moment pour retracer nos pas sur la façon dont nous sommes arrivés ici, où cela nous laisse et comment nous avons l'intention de procéder.

Voir un vieux problème avec des yeux neufs

Historiquement, Moz a utilisé le même maintes et maintes fois pour créer un modèle d'autorité de page (ainsi qu'une autorité de domaine). L'avantage de ce modèle était sa simplicité, mais il laissait beaucoup à désirer.

Page précédente Modèles d'autorité formés par rapport aux SERP, essayant de prédire si une URL se classerait par rapport à une autre, sur la base d'un ensemble de mesures de lien calculées à partir de l'index de lien de retour de Link Explorer. Un problème clé avec ce type de modèle était qu'il ne pouvait pas traiter de manière significative la force maximale d'un ensemble particulier de métriques de lien.

Par exemple, imaginez les URL les plus puissantes sur Internet en termes de liens: les pages d'accueil de Google, Youtube, Facebook, ou les URL de partage des boutons de réseaux sociaux suivis. Il n'y a pas de SERP qui opposent ces URL les unes aux autres. Au lieu de cela, ces URL extrêmement puissantes se classent souvent n ° 1, suivies des pages avec des métriques considérablement inférieures. Imaginez si Michael Jordan, Kobe Bryant et Lebron James se disputaient chacun face à face contre des joueurs du secondaire. Chacun gagnerait à chaque fois. Mais nous aurions beaucoup de mal à extrapoler à partir de ces résultats si Michael Jordan, Kobe Bryant ou Lebron James gagneraient dans des compétitions individuelles les uns contre les autres.

Lorsqu'ils ont été chargés de revoir l'autorité de domaine, nous avons finalement choisi un modèle avec lequel nous avions une grande expérience: la méthode de formation d'origine des SERPs (bien qu'avec un certain nombre de modifications). Avec Page Authority, nous avons décidé d'adopter une méthode de formation totalement différente en prédisant quelle page aurait le plus de trafic organique total. Ce modèle présentait plusieurs qualités prometteuses, comme la capacité de comparer des URL qui n'apparaissent pas sur le même SERP, mais présentait également d'autres difficultés, comme une page ayant une grande équité de liens mais simplement se trouvant dans une zone de sujet rarement recherchée. Nous avons abordé bon nombre de ces problèmes, comme l'amélioration de l'ensemble de formation, pour tenir compte de la compétitivité à l'aide d'une métrique sans lien.

Mesure de la qualité de la nouvelle autorité de page

Les résultats étaient – et sont – très prometteurs.

Premièrement, le nouveau modèle prédisait évidemment la probabilité qu'une page aurait un trafic organique plus précieux qu'une autre. On s'y attendait, car le nouveau modèle visait cet objectif particulier, tandis que l'actuelle autorité de page tentait simplement de prédire si une page se classerait sur une autre.

Deuxièmement, nous avons constaté que le nouveau modèle prédisait si une page se classerait au-dessus une autre meilleure que la précédente autorité de page. Cela a été particulièrement agréable, car cela a dissipé bon nombre de nos craintes que le nouveau modèle sous-performerait les anciens contrôles de qualité en raison du nouveau modèle de formation.

Dans quelle mesure le nouveau modèle est-il meilleur pour prédire les SERPs que le PA actuel? À chaque intervalle – jusqu'à la position 4 contre 5 – le nouveau modèle est à égalité ou surpasse le modèle actuel. Il n'a jamais perdu.

Tout était superbe. Nous avons ensuite commencé à analyser les valeurs aberrantes. J'aime appeler cela le "est-ce que quelque chose a l'air stupide?" tester. L'apprentissage automatique fait des erreurs, tout comme les humains peuvent le faire, mais les humains ont tendance à faire des erreurs d'une manière très particulière. Lorsqu'un humain fait une erreur, nous comprenons souvent exactement pourquoi l'erreur a été commise. Ce n’est pas le cas du ML, en particulier des Neural Nets; nous avons extrait des URL avec des autorités de page élevées sous le nouveau modèle qui ne présentaient aucun trafic organique, et nous les avons incluses dans l'ensemble de formation pour apprendre à détecter ces erreurs. Nous avons rapidement vu 90+ PA bizarres tomber à des années 60 et 70 beaucoup plus raisonnables… une autre victoire.

Nous étions à un dernier test.

Le problème avec la recherche de marque

Certains des mots-clés les plus populaires sur le Web sont de navigation. Les gens recherchent sur Google Facebook, Youtube et même Google lui-même. Ces mots-clés sont recherchés un nombre astronomique de fois par rapport aux autres mots-clés. Par la suite, une poignée de marques très puissantes peuvent avoir un impact énorme sur un modèle qui examine le volume de recherche total dans le cadre de son objectif de formation principal.

Le dernier test consiste à comparer l'autorité de page actuelle à la nouvelle autorité de page, afin de déterminer s'il existe des valeurs aberrantes bizarres (où PA a changé de façon spectaculaire et sans raison évidente). Tout d’abord, regardons une simple comparaison du LOG ​​des domaines racine de liaison par rapport à l’autorité de page.

Pas trop minable. Nous constatons une corrélation généralement positive entre la liaison des domaines racines et l'autorité de page. Mais pouvez-vous repérer les bizarreries? Allez-y et prenez une minute…

Il y a deux anomalies qui ressortent de ce graphique:

  1. Il y a un curieux écart séparant la distribution principale des URL et les valeurs aberrantes au-dessus et au-dessous.
  2. La plus grande variance pour un le score unique est à PA 99. Il y a énormément de PA 99 avec un large éventail de domaines racine de liaison.

Voici une visualisation qui vous aidera à dégager ces anomalies:

Les espaces gris entre le vert et le rouge représentent cet écart étrange entre le gros de la distribution et les valeurs aberrantes. Les valeurs aberrantes (en rouge) ont tendance à s'agglutiner, en particulier au-dessus de la distribution principale. Et, bien sûr, nous pouvons voir la mauvaise distribution au sommet des PA 99.

Gardez à l'esprit que ces problèmes ne sont pas suffisants pour rendre le nouveau modèle d'autorité de page moins précis que le modèle actuel. Cependant, après un examen plus approfondi, nous avons constaté que les erreurs générées par le modèle étaient suffisamment importantes pour pouvoir influer négativement sur les décisions de nos clients. Il vaut mieux avoir un modèle un peu partout (parce que les ajustements apportés par les référenceurs ne sont pas incroyablement ajustés) que d'avoir un modèle qui a raison la plupart du temps mais qui est bizarrement faux dans un nombre limité de cas. [19659032] Heureusement, nous sommes assez confiants quant à la nature du problème. Il semble que les AP de la page d'accueil soient exagérément gonflés et que le coupable probable soit l'ensemble de formation. Nous ne pouvons pas être sûrs que c'est la cause avant d'avoir terminé le recyclage, mais c'est une bonne piste.

La bonne et la mauvaise nouvelle

Nous sommes en bonne forme dans la mesure où nous avons plusieurs modèles candidats qui surpassent les Autorité de page existante. Nous sommes sur le point de supprimer les bogues, pas de créer des modèles. Cependant, nous n'allons pas livrer une nouvelle partition tant que nous ne serons pas convaincus que cela guidera nos clients dans la bonne direction. Nous sommes très conscients des décisions que nos clients prennent en fonction de nos métriques, et pas seulement de savoir si les métriques répondent à certains critères statistiques.

Compte tenu de tout cela, nous avons décidé de retarder le lancement de Page Authority 2.0. Cela nous donnera le temps nécessaire pour répondre à ces principales préoccupations et produire une métrique stellaire. Frustrant? Oui, mais également nécessaire.

Comme toujours, nous vous remercions de votre patience et nous sommes impatients de produire la meilleure métrique d'autorité de page que nous ayons jamais publiée.

Visitez le Centre de ressources PA

Inscrivez-vous au Moz Top 10 un mailer bimensuel vous mettant à jour sur les dix meilleures actualités SEO, astuces et liens rad découverts par l'équipe Moz. Considérez-le comme votre résumé exclusif de choses que vous n'avez pas le temps de traquer mais que vous voulez lire!




Source link