Fermer

février 1, 2021

Prévisions SEO dans Google Sheets


Posté par Tom.Capper

En 2015, j'ai publié un article donnant un outil de prévision gratuit et simple et présentant des cas d'utilisation pour la prévision en SEO. C'était un moyen rapide et efficace de voir si une modification du trafic de votre site est une sorte de saisonnalité que vous pouvez ignorer, quelque chose à célébrer ou un signe inquiétant de perte de trafic.

En bref: vous pouvez entrer dans une série de

Cinq ans plus tard, je reçois toujours des gens – d'anciens collègues à de parfaits inconnus – qui me posent des questions sur cet outil, et le plus souvent, je suis a demandé une version qui fonctionne directement dans les feuilles de calcul.

Je trouve cela facile à comprendre: une feuille de calcul est plus flexible, plus facile à déboguer, plus facile à développer, plus facile à maintenir et un format que les gens connaissent très bien.

Le compromis lors de l'optimisation de ces choses est que, bien que j'aie amélioré cet outil il y a quelques années, j'ai encore dû garder les choses gérables dans l'environnement de programmation célèbre et instable qu'est Excel / Google Sheets. Cela signifie que le modèle partagé dans cet article utilise un modèle plus simple et légèrement moins performant que certains outils avec exécution de code externe (par exemple Forecast Forge ).

Dans cet article, je vais donnez un modèle gratuit, montrez-vous comment il fonctionne et comment l'utiliser, puis vous montrez comment créer votre propre (meilleure?) version. (Si vous avez besoin d'un rappel pour savoir quand utiliser les prévisions en général et des concepts comme les intervalles de confiance, reportez-vous à l'article original lié ci-dessus.).

Types de prévisions SEO

Il y a une chose sur laquelle je veux développer avant nous entrons dans la feuille de calcul: les différents types de prévisions SEO.

En gros, je pense que vous pouvez classer les prévisions SEO en trois groupes:

  1. "Je me sens optimiste – ajoutez 20% à cette année" ou des changements fixes similaires aux chiffres existants. Des versions plus complexes peuvent ajouter seulement 20% à certains groupes de pages ou de mots clés. Je pense que de nombreuses agences utilisent ce type de prévision dans les pitchs, et cela revient à tirer parti de l'expérience.
  2. Modèles de mots-clés / CTR, lorsque vous estimez un changement de classement (ou un ensemble de changements de classement), extrapolez ensuite le résultat changement de trafic à partir du volume de recherche et des données de CTR (vous pouvez voir une méthodologie similaire ici ). Encore une fois, des versions plus complexes peuvent avoir une base pour le changement de classement (par exemple, "Et si nous échangions des places avec le concurrent A dans chaque mot-clé du groupe X où ils nous dépassent actuellement?").
  3. Prévisions statistiques basées sur des données historiques, lorsque vous extrapolez à partir des tendances et de la saisonnalité précédentes pour voir ce qui se passerait si tout restait constant (même niveau d'activité marketing de votre part et de vos concurrents, etc.).

Le type deux a ses mérites, mais si vous comparez les goûts de Ahrefs / SEMRush / Sistrix données à vos propres analyses, vous verrez combien il est difficile de généraliser. En passant, je ne pense pas que le type 1 soit aussi ridicule qu'il en a l'air, mais ce n'est pas quelque chose que j'explorerai plus en détail dans ce post. Dans tous les cas, le modèle de cet article correspond au type 3.

Qu'est-ce qui en fait une prévision SEO?

Pourquoi, rien du tout. Une chose que vous remarquerez dans ma description du type 3 ci-dessus est qu'elle ne mentionne rien de spécifique au référencement. Cela pourrait également s'appliquer au trafic direct, par exemple. Cela dit, il y a deux raisons pour lesquelles je suggère cela spécifiquement comme une prévision SEO:

  • Nous sommes sur le blog Moz et je suis consultant SEO.
  • Il existe de meilleures méthodologies disponibles pour beaucoup de d'autres canaux.

J'ai mentionné que le type deux ci-dessus est très difficile, et cela est dû à la nature hautement non déterministe du référencement et à la qualité généralement médiocre des données détaillées dans la Search Console et d'autres plates-formes spécifiques au référencement. En outre, pour avoir une idée précise de la saisonnalité, vous devez avoir entreposé les données de votre Search Console depuis au moins deux ans.

Pour de nombreux autres canaux, il existe des données historiques détaillées de haute qualité et des relations sont beaucoup plus prévisibles, permettant des prévisions plus granulaires. Par exemple, pour la recherche payante, l'outil Forecast Forge que j'ai mentionné ci-dessus intègre des facteurs tels que les données de conversion au niveau des mots clés et le coût par clic en fonction de vos données historiques, d'une manière qui serait extrêmement impraticable pour SEO.

Cela dit, nous pouvons toujours combiner plusieurs types de prévisions dans le modèle ci-dessous. Par exemple, plutôt que de prévoir le trafic de votre site dans son ensemble, vous pouvez prévoir les sous-dossiers séparément, ou marque / non-marque séparément, et vous pouvez ensuite appliquer une croissance en pourcentage à certains domaines ou intégrer les changements de classement prévus. Mais nous prenons de l'avance sur nous-mêmes…

Comment utiliser le modèle

MODÈLE GRATUIT

La première chose à faire est de faire une copie (sous le menu «Fichier» en haut à gauche, mais automatique avec le lien que j'ai inclus). Cela signifie que vous pouvez entrer vos propres données et jouer à votre guise, et vous pouvez toujours revenir et en obtenir une nouvelle copie plus tard si vous en avez besoin.

Ensuite, sur le premier onglet, vous remarquerez que certaines cellules ont une surbrillance verte ou bleue:

Vous ne devez modifier les valeurs que dans les cellules colorées.

Les cellules bleues de la colonne E servent essentiellement à s'assurer que tout est correctement étiqueté dans la sortie. Ainsi, par exemple, si vous collez des données de session, des données de clic ou des données de revenus, vous pouvez définir ce libellé. De même, si vous entrez un mois de début de 2018-01 et 36 mois de données historiques, la sortie des prévisions commencera en janvier 2021.

Sur cette note, il doit s'agir de données mensuelles – c'est l'un des compromis pour la simplicité I mentionné précédemment. Vous pouvez coller jusqu'à une décennie de données mensuelles historiques dans la colonne B, en commençant par la cellule B2, mais vous devez faire attention à quelques points:

  • Vous avez besoin d'au moins 24 mois de données pour que le modèle dispose une bonne idée de la saisonnalité. (S'il n'y a qu'un seul janvier dans vos données historiques et qu'il s'agissait d'un pic de trafic, comment suis-je censé savoir s'il s'agissait d'un événement ponctuel ou annuel?)
  • Il vous faut des mois complets. Donc, si vous lisez ceci le 25 mars 2021, le dernier mois de données que vous devriez inclure est février 2021.

Assurez-vous de supprimer également les restes de mes données d'exemple dans la colonne B.

Outputs

] Une fois que vous avez fait cela, vous pouvez vous diriger vers l'onglet "Sorties", où vous verrez quelque chose comme ceci:

La colonne C est probablement celle qui vous intéresse. Gardez à l'esprit qu'elle est pleine de ici, mais vous pouvez copier et coller comme valeurs dans une autre feuille, ou aller simplement dans Fichier> Télécharger> Valeurs séparées par des virgules pour obtenir les données brutes.

Vous remarquerez que je ne suis que montrant 15 mois de prévisions dans ce graphique par défaut, et je vous recommande de faire de même. Comme je l'ai mentionné ci-dessus, l'hypothèse implicite d'une prévision est que le contexte historique se perpétue, à moins que vous n'incluiez explicitement des scénarios modifiés tels que les verrouillages COVID dans votre modèle (plus à ce sujet dans un instant!). La probabilité que cette hypothèse se maintienne deux ou trois ans dans le futur est faible, donc même si j'ai fourni des valeurs de prévision plus loin dans le futur, gardez cela à l'esprit.

Les limites supérieures et inférieures indiquées sont de confiance à 95% intervalles – encore une fois, vous pouvez récapituler sur ce que cela signifie dans mon message précédent si vous le souhaitez.

Cas d'utilisation avancés

Vous avez peut-être déjà remarqué l'onglet "Avancé":

Bien que j'aie dit que je voulais garder cela simple, j'ai senti que compte tenu de tout ce qui s'est passé en 2020, de nombreuses personnes devraient intégrer des facteurs externes majeurs dans leur modèle.

Dans l'exemple ci-dessus, j'ai rempli la colonne B avec une variable indiquant si le Royaume-Uni était ou non verrouillé par COVID. J'ai utilisé «0,5» pour indiquer que nous sommes entrés dans le verrouillage à la mi-mars.

Vous pouvez probablement faire mieux pour les facteurs pertinents pour votre entreprise, mais il y a quelques points importants à garder à l'esprit. tab:

  • C'est bien de le laisser complètement intact si vous ne voulez pas ajouter ces variables supplémentaires.
  • Allez de gauche à droite – vous pouvez laisser la colonne C vide si vous utilisez la colonne B, mais c'est pas bien de laisser B vide si vous utilisez C.
  • Si vous utilisez une variable « dummy » (par exemple, «1» pour quelque chose qui est actif), vous devez vous assurer de remplir dans les 0 dans d'autres cellules pendant au moins la période de vos données historiques.
  • Vous pouvez entrer des valeurs futures – par exemple, si vous prévoyez un verrouillage COVID en mars 2021 (salaud!), vous pouvez entrer quelque chose dans cette cellule il est donc incorporé dans la prévision.
  • Si vous n'entrez pas de valeurs futures, le modèle effectuera des prédictions basées sur ce nombre dans le futur. Par conséquent, si vous avez entré «PPC de marque actif» comme variable fictive pour les données historiques, puis que vous l'avez laissé vide pour les périodes futures, le modèle supposera que vous avez désactivé le PPC de marque à l'avenir.
  • Ajout de trop de données ici pendant trop peu de périodes historiques, cela entraînera quelque chose appelé « overfit » – je ne veux pas entrer dans les détails à ce sujet, c'est pourquoi cet onglet s'appelle «Avancé», mais essayez de ne pas vous laisser emporter .

Voici quelques exemples d'utilisation de cet onglet que vous devez prendre en compte:

  • Indiquez si le PPC de marque était actif (0 ou 1)
  • Indiquez si vous diffusez des publicités télévisées ou non
  • Entrez les verrouillages COVID
  • Saisissez les mises à jour d'algorithmes qui étaient importantes pour votre entreprise (une colonne par mise à jour)

Pourquoi mes estimations sont-elles différentes de votre ancien outil?

Il y a deux différences de méthode majeures entre ce modèle et mon ancien outil:

  • L'ancien outil utilisait la bibliothèque Causal Impact de Google, le nouveau modèle utilise un Ordinary Régression des moindres carrés .
  • L'ancien outil capturait les tendances non linéaires en utilisant la période au carré comme variable prédictive (par exemple, mois 1 = 1, mois 2 = 4, mois 3 = 9, etc.) et en essayant de adaptez la courbe de trafic à cette courbe. C'est ce qu'on appelle une régression quadratique . Le nouvel outil capture les tendances non linéaires en ajustant chaque période comme un multiple de la période précédente (par exemple, mois 1 = X * mois 2 où X peut être n'importe quelle valeur). C'est ce qu'on appelle un modèle AR (1) .

Si vous constatez une différence significative dans les valeurs de prévision entre les deux, cela revient presque certainement à la deuxième raison, et même si cela ajoute un peu de complexité, dans la grande majorité des cas, la nouvelle technique est plus réaliste et flexible.

Il est également beaucoup moins probable de prédire un trafic nul ou négatif dans le cas d'une tendance à la baisse sévère, ce qui est bien.

Il y a un onglet caché dans le modèle où vous pouvez jeter un coup d'œil, mais la version courte est la formule de feuille de calcul « LINEST () ».

Les entrées que j'utilise sont:

  • Variables dépendantes
    • Tout ce que vous mettez comme colonne B dans l'onglet entrées (comme le trafic)
  • Variables indépendantes
    • Passage linéaire de time
    • Trafic de la période précédente
    • Variables fictives pour 11 mois (le 12ème mois est représenté par les 11 autres variables étant toutes égales à 0)
    • Jusqu'à trois variables «avancées»

La formule donne ensuite une série de «coefficients» en tant que sorties, qui peuvent être multipliés par des valeurs et additionnés pour former une prédiction comme:

  • Trafic «période 10» = Interception + (Coefficient de temps * 10) + (Coefficient de période précédente * Trafic de la période 9)

Vous pouvez voir dans cette feuille cachée que j'ai étiqueté et codé par couleur un grand nombre des sorties de la formule Linest, ce qui peut vous aider à démarrer si vous voulez jouer avec vous-même. [19659008] Extensions potentielles

Si vous voulez jouer avec vous-même, en voici quelques-unes comme je pense personnellement à une extension supplémentaire que vous pourriez trouver intéressante:

  • Données quotidiennes au lieu de mensuelles, avec saisonnalité hebdomadaire (par ex. tous les dimanches)
  • Objectifs de croissance intégrés (par exemple, entrez 20% de croissance d'ici la fin de 2021)

Richard Fergie dont j'ai mentionné l'outil de prévision Forge à plusieurs reprises ci-dessus, a également fourni quelques excellentes suggestions pour améliorer la précision des prévisions avec une complexité supplémentaire assez limitée:

  • Lisser les données et éviter les prédictions négatives dans les cas extrêmes en prenant le log () des entrées, et en fournissant un exposant des sorties (le lissage des données peut ou non être une bonne chose selon votre point de vue!).
  • Régression sur les 12 mois précédents, au lieu d'utiliser le mois précédent + saisonnalité (cela nécessite au minimum 3 ans de données historiques)

Je peux ou non inclure tout ou partie des au-dessus de moi-même au fil du temps, mais si tel est le cas, je m'assurerai d'utiliser le même lien et de le noter dans la feuille de calcul, de sorte que cet article renvoie toujours à la version la plus à jour.

Si vous avez est arrivé jusqu'ici, qu'aimeriez-vous voir? Faites-le moi savoir dans les commentaires!

Inscrivez-vous au Moz Top 10 un mailer bimensuel vous mettant à jour sur les dix meilleures actualités SEO, astuces et liens rad découverts par l'équipe Moz. Considérez-le comme votre résumé exclusif de choses que vous n'avez pas le temps de traquer mais que vous voulez lire!




Source link