Fermer

novembre 22, 2019

Meilleur contenu grâce au traitement du langage naturel – Whiteboard Friday12 minutes de lecture

Meilleur contenu grâce au traitement du langage naturel - Whiteboard Friday


L'optimisation du contenu destiné aux moteurs de recherche est révolue. Pour un référencement moderne, votre contenu doit plaire aux robots et humains. Mais comment savez-vous que ce que vous écrivez peut cocher les cases homme-machine?

Au tableau blanc d'aujourd'hui, Ruth Burr Reedy se concentre sur une partie de son récent MozCon 2019 talk et nous enseigne explique comment Google utilise le traitement automatique du langage naturel (NLP) pour bien comprendre le contenu, et comment exploiter ces connaissances pour optimiser ce que vous écrivez, qu'il s'agisse de personnes ou de robots.

Cliquez sur l'image du tableau blanc ci-dessus pour ouvrir une version en haute résolution dans un nouvel onglet!

Transcription vidéo

Howdy, fans de Moz. Je m'appelle Ruth Burr Reedy et je suis vice-présidente de la stratégie chez UpBuild, une agence de marketing technique spécialisée dans le référencement technique et l'analyse Web avancée. À MozCon, j’ai récemment abordé un cadre de base pour le référencement et les changements à venir dans notre secteur qui envisage le référencement à la lumière du fait que nous sommes des êtres humains qui vendons à des humains, mais nous utilisons une machine comme intermédiaire.

être disponible en ligne à un moment donné. [Editor’s note: that point is now!] Mais aujourd’hui, je voulais aborder un point de mon exposé que j’ai trouvé vraiment intéressant et qui a en quelque sorte changé ma façon d’aborder la création de contenu, et c’est l’idée que rédiger un contenu plus facile à comprendre pour Google, un robot, peut en réalité faire de vous un meilleur rédacteur et vous aider à rédiger un meilleur contenu pour les humains. C'est un gagnant-gagnant.

Relations entre les entités, les mots et la façon dont les gens recherchent

Pour comprendre comment Google aborde actuellement l'analyse du contenu et la compréhension de son contenu, Google consacre beaucoup de temps, d'énergie et d'argent. sur des choses comme la correspondance neurale et le traitement du langage naturel qui cherchent à comprendre fondamentalement quand les gens parlent, de quoi parlent-ils?

Cela va de pair avec l'évolution de la recherche d'être plus conversationnel. Cependant, il arrive très souvent que quelqu'un effectue une recherche, mais il ne sait pas tout à fait ce qu'il veut et Google veut toujours qu'il obtienne ce qu'il veut, car c'est ainsi que Google gagne de l'argent. Ils passent beaucoup de temps à essayer de comprendre les relations entre les entités et entre les mots et comment les gens utilisent les mots pour effectuer une recherche.

L'exemple donné en ligne par Danny Sullivan est, je pense, un très bon exemple, celui d'une expérience vécue. l'effet de feuilleton sur leur téléviseur. Si vous avez déjà vu un feuilleton, vous avez remarqué qu’ils avaient l’air bizarre. Quelqu'un pourrait en être victime et ne pas savoir comment cela s'appelle, il ne peut pas utiliser l'effet de feuilleton parce qu'ils l'ignorent.

Ils pourraient rechercher quelque chose du type "Pourquoi ma télévision a-t-elle un air drôle?" La correspondance neuronale aide Google à comprendre que lorsque quelqu'un recherche "Pourquoi mon téléviseur a-t-il l'air drôle?" une réponse possible pourrait être l’effet feuilleton. Ils peuvent donc servir ce résultat et les gens sont heureux.

Compréhension de la saillance

En ce qui concerne le traitement du langage naturel, un élément essentiel du traitement de la langue naturelle est la compréhension de la saillance .

de la saillance, du contenu et des entités

de la saillance . ] est un moyen en un mot de résumer dans quelle mesure ce contenu concerne cette entité spécifique? À ce stade, Google est vraiment doué pour extraire des entités d'un contenu. Les entités sont essentiellement des noms, des personnes, des lieux, des choses, des noms propres, des noms normaux.

Les entités sont des choses, des personnes, etc., des nombres, des choses comme ça. Google est vraiment doué pour sortir ces personnes et leur dire: "D'accord, voici toutes les entités contenues dans ce contenu." Salience tente de comprendre les liens qui unissent les uns aux autres, car ce que Google essaie vraiment de comprendre lorsqu'ils explorent une page, c'est: De quoi parle cette page et s'agit-il d'un bon exemple de page sur ce sujet sujet?

La saillance va vraiment dans le deuxième morceau. Dans quelle mesure une entité donnée fait-elle l'objet d'un élément de contenu? Il est souvent étonnant de constater à quel point un contenu créé par une personne ne concerne en réalité rien. Je pense que nous avons tous vécu cela.

Vous recherchez et vous arrivez à une page et vous vous dites: "C’était trop vague. C’était trop large. Cela disait qu’il s’agissait d’une chose, mais était en fait d’autre chose. Je n’ai pas trouvé ce dont j'avais besoin. Ce n’était pas une bonne information pour moi. " En tant que spécialistes du marketing, nous sommes souvent du côté opposé. Nous essayons de demander à nos clients de dire ce que leur produit fait réellement sur leur site Web ou de dire: "Je sais que vous pensez que vous avez créé un guide sur Instagram pour les vacances. Mais vous En fait, vous avez écrit un paragraphe sur les vacances, puis sept paragraphes sur votre nouvel outil Instagram. Il ne s'agit pas d'un article de blog sur Instagram pour les vacances. C'est un élément de contenu relatif à votre outil. " Ce sont le genre de batailles que nous menons en tant que spécialistes du marketing.

API de traitement du langage naturel

Heureusement, il existe maintenant un certain nombre d'API que vous pouvez utiliser pour comprendre le traitement du langage naturel:

Est-ce aussi sophistiqué que ce qu'ils utilisent eux-mêmes? ? Probablement pas. Mais vous pouvez le tester. Mettez un élément de contenu et voyez (a) quelles entités Google peut en extraire et (b) à quel point Google estime-t-il que chacune de ces entités joue un rôle fondamental dans l'ensemble du contenu. De nouveau, dans quelle mesure ce contenu concerne-t-il cette chose?

Donc, cette API de traitement de langage naturel, que vous pouvez essayer gratuitement et qui n’est pas si chère pour une API si vous vouloir construire un outil avec, assignera à chaque entité le moyen d'extraire un score saillant entre 0 et 1, en disant: "OK, dans quelle mesure sommes-nous sûrs que ce contenu est à propos de cette chose par rapport à son contenu?" [19659002] Ainsi, plus vous vous rapprochez de 1, plus l'outil est sûr que ce contenu est à propos de cette chose. 0,9 serait vraiment, vraiment bien. 0,01 signifie que c'est là, mais ils ne savent pas à quel point c'est lié.

Un exemple délicieux du fonctionnement de la saillance et des entités

L'exemple que j'ai ici, et qui ne provient pas d'un contenu réel – ces chiffres sont inventés, c'est juste un exemple – est si vous aviez un chocolat recette à base de biscuits aux pépites, vous voudriez des biscuits au chocolat ou des pépites de chocolat, des pépites de chocolat, quelque chose dans ce genre, qui soit l’entité numéro un, l’entité la plus saillante, et vous voudriez qu’elle obtienne un score saillant assez élevé.

Vous voudriez que l'outil soit assez confiant, oui, cette partie du contenu concerne ce sujet. Mais ce que vous pouvez également voir, ce sont les autres entités qu’elle extrait et dans quelle mesure elles sont également saillantes pour le sujet. Ainsi, vous pouvez voir des choses comme si vous avez une recette de biscuits aux pépites de chocolat, vous vous attendriez à voir des choses comme des biscuits, du beurre, du sucre, 350, qui est la température à laquelle vous chauffez votre four, toutes les choses qui se combinent pour faire une recette de biscuits aux brisures de chocolat.

Mais je pense qu’il est vraiment très important pour nous, les SEO, de comprendre que la saillance est l’avenir des mots clés associés . Nous n’avons plus le temps d’optimiser notre recette de biscuits aux pépites de chocolat, nous sommes également à la recherche de choses telles que les recettes au chocolat, les pépites de chocolat, les recettes de biscuits au chocolat, etc. Tiges, variantes, TF-IDF, ce sont toutes des méthodologies plus anciennes pour comprendre en quoi consiste un élément de contenu.

Nous devons plutôt comprendre quelles sont les entités que Google utilise, en utilisant son vaste corpus de connaissances, en utilisant des éléments tels que Freebase, utilisant de grandes parties de l'internet, où Google voit ces entités co-se produire à une vitesse telle qu'elles se sentent raisonnablement convaincues qu'un élément de contenu d'une entité afin d'être saillant à cette entité inclurait ces autres

Le meilleur moyen de créer un contenu pertinent pour un sujet est de faire appel à un expert

Alors, recette de biscuits aux brisures de chocolat, nous nous assurons également d'ajouter du beurre, de la farine et du sucre . C'est en fait très facile à faire si vous avez une recette de biscuits aux pépites de chocolat à mettre en place. C’est à mon sens que ce que nous allons commencer à considérer comme une tendance de contenu dans le référencement est que le meilleur moyen de créer un contenu qui est d’une importance capitale pour un sujet est d’avoir un expert sur ce sujet qui le crée. ]

Une personne ayant une connaissance approfondie d'un sujet va naturellement inclure les termes cooccurrents, car elle sait comment créer quelque chose qui correspond à ce qu'il est supposé être. Je pense que ce que nous allons commencer à voir, c'est que les gens vont devoir commencer à payer davantage pour le marketing de contenu, franchement. Malheureusement, beaucoup d'entreprises semblent penser que le marketing de contenu est et devrait être bon marché.

Les spécialistes du marketing de contenu, je pense que vous en êtes conscient. C'est nul, et ce n'est plus le cas. Nous devons commencer à investir dans le contenu et dans les experts pour créer ce contenu afin qu’ils puissent créer ce contenu profond, riche et remarquable dont tout le monde a réellement besoin.

Comment pouvez-vous utiliser cette API pour améliorer votre propre référencement?

L’une des choses que j’aime faire avec ce type d’information est de regarder – et c’est quelque chose que je fais depuis des années, mais pas dans ce contexte – mais les pages qui classent pour un sujet, mais ils se classent à la page 2.

Cela signifie souvent que Google comprend que ce mot clé est un sujet de la page, mais ne comprend pas nécessairement qu'il s'agit d'un bon contenu sur ce sujet. , que la page traite uniquement de ce contenu, que c'est une bonne ressource. En d'autres termes, le signal est là, mais il est faible.

Ce que vous pouvez faire est de prendre un contenu qui se classe mais ne fonctionne pas bien, de l'exécuter via cette API de langage naturel ou un autre outil de traitement de langage naturel, et Examinez comment les entités sont extraites et comment Google détermine qu'elles sont liées les unes aux autres. Parfois, il se peut que vous deviez faire de la désambiguïsation. Ainsi, dans cet exemple, vous remarquerez que même si les biscuits au chocolat sont appelés œuvres d'art, et je suis d'accord, les biscuits ici s'appellent en réalité autres.

Cela est dû au fait que le terme "biscuit" signifie plus qu'une chose. Il y a les cookies, les produits cuits au four, mais il y a aussi les cookies, le paquet de données. Les deux sont des utilisations légitimes du mot "cookie". Les mots ont plusieurs significations. Si vous remarquez que Google, cette API de traitement de langage naturel ne parvient pas à classer correctement vos entités, c’est un bon moment pour commencer à faire de la désambiguïsation.

Assurez-vous que les termes qui entourent ce terme indiquent clairement «Non, Je parle des produits cuits au four, pas des données logicielles. " C'est un très bon moyen d'augmenter votre visibilité. Regardez si vous avez un score saillant fort pour votre entité principale. Vous seriez surpris du nombre de contenus que vous pouvez brancher sur cet outil, et l'entité la plus saillante n'est encore qu'un 0.01, un 0.14.

Souvent, l'API ressemble à "Je pense que c'est de quoi il s'agit ", mais ce n'est pas sûr. C’est le moment idéal pour publier ce contenu, le rendre plus robuste et rechercher des moyens de rendre ces entités plus faciles à extraire et à établir des relations les unes avec les autres. Cela m'amène à mon deuxième point, qui est mon nouveau truc préféré dans le monde.

Écrire pour des humains et écrire pour des machines, vous pouvez maintenant faire les deux en même temps. Vous n'avez plus à le faire et vous ne l'avez pas vraiment fait depuis longtemps, mais l'idée que vous puissiez créer des mots-clés ou créer du contenu pour Google que les utilisateurs risquent de ne pas voir ou qui importent, est comme suit:

Vous pouvez désormais créer un contenu plus convivial pour Google, car les principes de lisibilité de la machine et de lisibilité humaine se rapprochent de plus en plus.

Conseils pour l'écriture en vue d'une lisibilité humaine et machine:

 Réduisez les distances sémantiques! "Title =" Réduisez les distances sémantiques! "Style =" box-shadow: 0 0 10px 0 # 999; border-radius: 20px; "/></figure data-recalc-dims=

Ce que j’ai fait ici est que j’ai fait des recherches non pas sur le traitement du langage naturel, mais sur l’écriture pour la lisibilité humaine, c’est-à-dire les conseils d’écrivains, d’experts en rédaction, sur la façon de mieux écrire plus clair, plus facile à lire, plus facile à comprendre le contenu.Ensuite, j’ai tiré les conseils qui servent également de conseils pour l’écriture pour le traitement automatique du langage. Le traitement naturel des langues est donc le processus par lequel Google ou quoi que ce soit réellement le langage de traitement tente peut-être de comprendre comment les entités sont liées dans un corps de contenu donné.

Phrases courtes et simples

Phrases courtes et simples. Ecrivez simplement. N'utilisez pas beaucoup de langage fleuri. Prononcez des phrases courtes et essayez de vous en tenir à une idée par phrase.

Une idée par phrase

Si vous courez, si vous avez beaucoup de clauses différentes, si vous utilisez beaucoup de pronoms et il devient confus de quoi vous parlez, ce n'est pas grave t pour les lecteurs.

Il est également plus difficile pour les machines d’analyser votre contenu.

Reliez les questions aux réponses

Puis reliez étroitement les questions aux réponses. Alors ne dites pas: "Quelle est la meilleure température pour faire des biscuits? Eh bien, laissez-moi vous raconter une histoire à propos de ma grand-mère et de mon enfance", et 500 mots plus tard, voici la réponse. Reliez les questions aux réponses.

Ces trois conseils de lisibilité ont en commun de réduire la distance sémantique entre entités .

Si vous voulez que le traitement du langage naturel comprenne que deux entités de votre contenu sont proches liées, rapprochez-les dans la phrase. Rapprochez les mots. Réduisez l'encombrement, réduisez les mouvements, réduisez le nombre de sauts sémantiques qu'un robot pourrait devoir effectuer entre entités pour comprendre la relation, et vous avez maintenant créé un contenu plus lisible, car plus court et plus facile à parcourir, mais aussi plus facile pour un robot d'analyser et de comprendre.

Soyez précis en premier, puis expliquez la nuance

Pour en revenir à l'exemple de "Quelle est la meilleure température pour la cuisson de biscuits aux pépites de chocolat?" Maintenant, la vraie réponse à la température idéale pour préparer des biscuits au chocolat est que cela dépend. Bonjour. Bonjour, je suis un référencement, et je viens de répondre à une question avec ça dépend. Cela dépend.

C'est vrai, c'est vrai, mais ce n'est pas une bonne réponse. Ce n’est pas non plus le genre de chose qu’un robot pourrait extraire et reproduire, par exemple, dans une recherche vocale ou un extrait de code. Si quelqu'un dit: "D'accord, Google, à quelle température peut-on faire des biscuits?" et Google dit: "Cela dépend", cela n'aide personne même si c'est vrai. Donc, afin d'écrire pour la lisibilité à la fois sur la machine et sur l'homme, soyez précis d'abord et ensuite vous pourrez expliquer la nuance.

Ensuite, vous pouvez entrer dans les détails. Donc, une réponse tout aussi correcte et correcte: "Quelle est la température pour faire des biscuits aux pépites de chocolat?" La température idéale pour la cuisson des biscuits aux pépites de chocolat est généralement comprise entre 325 et 425 degrés, en fonction de votre altitude et de la netteté de votre biscuit. C'est tout aussi vrai que cela dépend et, en fait, signifie la même chose, mais c'est beaucoup plus précis.

C'est beaucoup plus précis. Il utilise des nombres réels. C'est une vraie réponse. J'ai raccourci la distance entre la question et la réponse. Je n'ai pas dit que cela dépendait en premier. J'ai dit ça dépend à la fin. C'est le genre de chose que vous pouvez faire pour améliorer la lisibilité et la compréhension, à la fois pour l'homme et pour la machine.

Allez droit au but (n'enterrez pas la lumière)

Allez droit au but. Ne pas enterrer la tête. Tous les journalistes qui essaient de devenir des spécialistes du marketing de contenu, puis tous les acteurs du marketing de contenu ont dit: "Oh, vous devez attendre la fin pour comprendre votre argument, sinon ils ne liront pas l'intégralité du texte", et vous étiez comme "Ne pas enterrer l'avance", vous avez raison. Pour ceux d'entre vous qui ne sont pas familiers avec le journalisme, ne pas enterrer le fil signifie essentiellement aller au fond des choses, au sommet.

Incluez toute l'information que quelqu'un aurait vraiment besoin d'obtenir de ce contenu. S'ils ne lisent rien d'autre, ils lisent ce paragraphe et ils ont compris l'essentiel. Alors les gens qui veulent aller en profondeur peuvent aller en profondeur. C'est ainsi que les gens aiment consommer du contenu, et étonnamment, cela ne signifie pas qu'ils ne liront pas le contenu. Cela signifie simplement qu'ils n'ont pas à le lire s'ils n'ont pas le temps, s'ils ont besoin d'une réponse rapide.

Il en va de même pour les machines. Obtenez le point de départ. Expliquez tout de suite quelle est l'entité principale, le sujet principal, l'objectif principal de votre contenu, puis entrez dans les détails. Vous aurez un contenu beaucoup mieux structuré qu'il est plus facile d'analyser de tous les côtés.

Évitez le jargon et le "langage marketing"

Évitez le jargon. Évitez de parler marketing. Non seulement c'est terrible et très difficile à comprendre. Vous voyez cela souvent. Je reviens encore à l'exemple de demander à vos clients de dire ce que font leurs produits. Vous travaillez avec de nombreuses entreprises B2B, vous allez souvent vous heurter à cela. Oui, mais que fait-il? Il fournit des solutions pour rationaliser le flux de travail et bla, bla. Ok, que fait-il? Il peut être très, très difficile pour les entreprises de se débrouiller seules, mais c'est tellement important pour les utilisateurs, pour les machines.

Évitez le jargon. Évitez de parler marketing. Pas trop tautologique, mais plus un mot est ésotérique, moins il est couramment utilisé. C'est en fait ce que signifie ésotérique. Cela signifie que moins un mot est utilisé couramment, moins il est probable que Google comprenne ses relations sémantiques avec d'autres entités.

Restez simple. Être spécifique. Dis ce que tu veux dire. Supprimez tout le jargon. En éliminant le jargon et le genre de discours marketing et le type de fluff qui peut arriver dans votre contenu, vous réduisez également les distances sémantiques entre les entités, ce qui les rend plus faciles à analyser.

Organisez vos informations en fonction du parcours de l'utilisateur.

Organisez-les et tracez-les au parcours de l'utilisateur. Pensez aux informations dont une personne pourrait avoir besoin et à l'ordre dans lequel elle pourrait en avoir besoin.

Décomposez les sous-thèmes avec les en-têtes

Déclarez-les ensuite avec les sous-titres. C'est comme un conseil d'écriture très, très basique, et pourtant vous ne le faites pas tous. Donc, si vous n'allez pas le faire pour vos utilisateurs, faites-le pour les machines.

Mettre en forme les listes avec des puces ou des chiffres

Vous pouvez également avoir un impact réel sur la skimmability des utilisateurs en divisant les listes avec des puces ou des chiffres.

Le point fort de ce procédé est que dresser une liste de puces ou de chiffres génère également des informations. plus facile pour un robot d'analyser et d'extraire. Si bon nombre de ces conseils semblent être les mêmes que ceux que vous utiliseriez pour obtenir des extraits présentés, ils le sont, car ils représentent en fait un très bon indicateur du fait que vous créez du contenu qu'un robot peut trouver, analyser, comprendre. et extraire, et c'est ce que vous voulez.

Donc, si vous ciblez des extraits en vedette, vous faites probablement déjà beaucoup de ces choses, du bon travail.

Grammaire et orthographe!

La dernière chose que je ne devrais pas avoir à dire, mais je vais dire, c'est que la grammaire, l'orthographe, la ponctuation et des choses de ce genre comptent absolument. Ils comptent pour les utilisateurs. Ils ne comptent pas pour tous les utilisateurs, mais comptent pour les utilisateurs. Ils comptent également dans les moteurs de recherche.

Des éléments comme la grammaire, l’orthographe et la ponctuation sont des signaux très, très faciles à rechercher et à analyser pour une machine. Google a été spécifique dans certaines choses, telles que les "Directives pour les évaluateurs de qualité", selon lesquelles un document bien écrit, bien structuré, bien orthographié et grammaticalement correct est un signe d'autorité. Je ne dis pas que le fait d'avoir un document très orthographié signifiera que vous foncez immédiatement au sommet des résultats.

Je dis que si vous n'êtes pas sur ce sujet, vous allez probablement vous faire mal. Alors, prenez le temps de vous assurer que tout est bien rangé. Vous pouvez utiliser l'anglais vernaculaire. Vous n'avez pas besoin d'être parfait "AP Style Guide" tout le temps. Mais assurez-vous que vous formatez les choses correctement du point de vue grammatical et technique. Ce que j'aime dans tout ça, c'est juste une bonne écriture.

C'est une bonne écriture. C'est facile à comprendre. C'est facile à analyser. Il est encore si difficile, en particulier dans le monde du marketing, de sortir de ce monde de jargon, d’arriver au fait, d’arrêter d’écrire 2 000 mots parce que nous pensons avoir besoin de 2 000 mots, de penser vraiment à ce que nous créons du contenu.

Utilisez ces outils pour comprendre à quel point votre contenu est lisible, compréhensible et compréhensible

J'espère donc pour le monde du référencement et pour vous que vous pourrez utiliser ces outils non seulement pour réfléchir à la manière de Composez la densité de mots-clés parfaite ou ce que vous voulez pour obtenir un score presque parfait sur la visibilité dans l'API de traitement du langage naturel. Ce que j'espère, c'est que vous utiliserez ces outils pour vous aider à comprendre comment le contenu est lisible, comment il est compréhensible, et à quel point votre contenu est compréhensible, à quel point votre contenu parle de ce que vous dites et de ce dont vous pensez qu'il est possible de créer. de meilleures choses pour les utilisateurs.

Cela fait d’Internet un meilleur endroit, et cela vous rapportera probablement de l’argent également. Donc, ce sont mes pensées. J'aimerais entendre dans les commentaires si vous utilisez maintenant l'API de traitement de langage naturel, si vous avez construit un outil avec elle, si vous voulez en créer un, que pensez-vous de cela, comment vous utilisez ceci, comment ça s'est passé. Dis-moi tout à propos de cela. Holla atcha girl.

Bon vendredi.

Transcription vidéo de Speechpad.com



Source link