novembre 22, 2019

Meilleur contenu grâce au traitement du langage naturel – Whiteboard Friday

L'optimisation du contenu destiné aux moteurs de recherche est révolue. Pour un référencement moderne, votre contenu doit plaire aux robots et humains. Mais comment savez-vous que ce que vous écrivez peut cocher les cases homme-machine?

Au tableau blanc d'aujourd'hui, Ruth Burr Reedy se concentre sur une partie de son récent MozCon 2019 talk et nous enseigne explique comment Google utilise le traitement automatique du langage naturel (NLP) pour bien comprendre le contenu, et comment exploiter ces connaissances pour optimiser ce que vous écrivez, qu'il s'agisse de personnes ou de robots.

Cliquez sur l'image du tableau blanc ci-dessus pour ouvrir une version en haute résolution dans un nouvel onglet!

Transcription vidéo

Howdy, fans de Moz. Je m'appelle Ruth Burr Reedy et je suis vice-présidente de la stratégie chez UpBuild, une agence de marketing technique spécialisée dans le référencement technique et l'analyse Web avancée. À MozCon, j’ai récemment abordé un cadre de base pour le référencement et les changements à venir dans notre secteur qui envisage le référencement à la lumière du fait que nous sommes des êtres humains qui vendons à des humains, mais nous utilisons une machine comme intermédiaire.

être disponible en ligne à un moment donné. [Editor’s note: that point is now!] Mais aujourd’hui, je voulais aborder un point de mon exposé que j’ai trouvé vraiment intéressant et qui a en quelque sorte changé ma façon d’aborder la création de contenu, et c’est l’idée que rédiger un contenu plus facile à comprendre pour Google, un robot, peut en réalité faire de vous un meilleur rédacteur et vous aider à rédiger un meilleur contenu pour les humains. C'est un gagnant-gagnant.

Relations entre les entités, les mots et la façon dont les gens recherchent

Pour comprendre comment Google aborde actuellement l'analyse du contenu et la compréhension de son contenu, Google consacre beaucoup de temps, d'énergie et d'argent. sur des choses comme la correspondance neurale et le traitement du langage naturel qui cherchent à comprendre fondamentalement quand les gens parlent, de quoi parlent-ils?

Cela va de pair avec l'évolution de la recherche d'être plus conversationnel. Cependant, il arrive très souvent que quelqu'un effectue une recherche, mais il ne sait pas tout à fait ce qu'il veut et Google veut toujours qu'il obtienne ce qu'il veut, car c'est ainsi que Google gagne de l'argent. Ils passent beaucoup de temps à essayer de comprendre les relations entre les entités et entre les mots et comment les gens utilisent les mots pour effectuer une recherche.

L'exemple donné en ligne par Danny Sullivan est, je pense, un très bon exemple, celui d'une expérience vécue. l'effet de feuilleton sur leur téléviseur. Si vous avez déjà vu un feuilleton, vous avez remarqué qu’ils avaient l’air bizarre. Quelqu'un pourrait en être victime et ne pas savoir comment cela s'appelle, il ne peut pas utiliser l'effet de feuilleton parce qu'ils l'ignorent.

Ils pourraient rechercher quelque chose du type "Pourquoi ma télévision a-t-elle un air drôle?" La correspondance neuronale aide Google à comprendre que lorsque quelqu'un recherche "Pourquoi mon téléviseur a-t-il l'air drôle?" une réponse possible pourrait être l’effet feuilleton. Ils peuvent donc servir ce résultat et les gens sont heureux.

Compréhension de la saillance

En ce qui concerne le traitement du langage naturel, un élément essentiel du traitement de la langue naturelle est la compréhension de la saillance .

de la saillance, du contenu et des entités

de la saillance . ] est un moyen en un mot de résumer dans quelle mesure ce contenu concerne cette entité spécifique? À ce stade, Google est vraiment doué pour extraire des entités d'un contenu. Les entités sont essentiellement des noms, des personnes, des lieux, des choses, des noms propres, des noms normaux.

Les entités sont des choses, des personnes, etc., des nombres, des choses comme ça. Google est vraiment doué pour sortir ces personnes et leur dire: "D'accord, voici toutes les entités contenues dans ce contenu." Salience tente de comprendre les liens qui unissent les uns aux autres, car ce que Google essaie vraiment de comprendre lorsqu'ils explorent une page, c'est: De quoi parle cette page et s'agit-il d'un bon exemple de page sur ce sujet sujet?

La saillance va vraiment dans le deuxième morceau. Dans quelle mesure une entité donnée fait-elle l'objet d'un élément de contenu? Il est souvent étonnant de constater à quel point un contenu créé par une personne ne concerne en réalité rien. Je pense que nous avons tous vécu cela.

Vous recherchez et vous arrivez à une page et vous vous dites: "C’était trop vague. C’était trop large. Cela disait qu’il s’agissait d’une chose, mais était en fait d’autre chose. Je n’ai pas trouvé ce dont j'avais besoin. Ce n’était pas une bonne information pour moi. " En tant que spécialistes du marketing, nous sommes souvent du côté opposé. Nous essayons de demander à nos clients de dire ce que leur produit fait réellement sur leur site Web ou de dire: "Je sais que vous pensez que vous avez créé un guide sur Instagram pour les vacances. Mais vous En fait, vous avez écrit un paragraphe sur les vacances, puis sept paragraphes sur votre nouvel outil Instagram. Il ne s'agit pas d'un article de blog sur Instagram pour les vacances. C'est un élément de contenu relatif à votre outil. " Ce sont le genre de batailles que nous menons en tant que spécialistes du marketing.

API de traitement du langage naturel

Heureusement, il existe maintenant un certain nombre d'API que vous pouvez utiliser pour comprendre le traitement du langage naturel:

Est-ce aussi sophistiqué que ce qu'ils utilisent eux-mêmes? ? Probablement pas. Mais vous pouvez le tester. Mettez un élément de contenu et voyez (a) quelles entités Google peut en extraire et (b) à quel point Google estime-t-il que chacune de ces entités joue un rôle fondamental dans l'ensemble du contenu. De nouveau, dans quelle mesure ce contenu concerne-t-il cette chose?

Donc, cette API de traitement de langage naturel, que vous pouvez essayer gratuitement et qui n’est pas si chère pour une API si vous vouloir construire un outil avec, assignera à chaque entité le moyen d'extraire un score saillant entre 0 et 1, en disant: "OK, dans quelle mesure sommes-nous sûrs que ce contenu est à propos de cette chose par rapport à son contenu?" [19659002] Ainsi, plus vous vous rapprochez de 1, plus l'outil est sûr que ce contenu est à propos de cette chose. 0,9 serait vraiment, vraiment bien. 0,01 signifie que c'est là, mais ils ne savent pas à quel point c'est lié.

Un exemple délicieux du fonctionnement de la saillance et des entités

L'exemple que j'ai ici, et qui ne provient pas d'un contenu réel – ces chiffres sont inventés, c'est juste un exemple – est si vous aviez un chocolat recette à base de biscuits aux pépites, vous voudriez des biscuits au chocolat ou des pépites de chocolat, des pépites de chocolat, quelque chose dans ce genre, qui soit l’entité numéro un, l’entité la plus saillante, et vous voudriez qu’elle obtienne un score saillant assez élevé.

Vous voudriez que l'outil soit assez confiant, oui, cette partie du contenu concerne ce sujet. Mais ce que vous pouvez également voir, ce sont les autres entités qu’elle extrait et dans quelle mesure elles sont également saillantes pour le sujet. Ainsi, vous pouvez voir des choses comme si vous avez une recette de biscuits aux pépites de chocolat, vous vous attendriez à voir des choses comme des biscuits, du beurre, du sucre, 350, qui est la température à laquelle vous chauffez votre four, toutes les choses qui se combinent pour faire une recette de biscuits aux brisures de chocolat.

Mais je pense qu’il est vraiment très important pour nous, les SEO, de comprendre que la saillance est l’avenir des mots clés associés . Nous n’avons plus le temps d’optimiser notre recette de biscuits aux pépites de chocolat, nous sommes également à la recherche de choses telles que les recettes au chocolat, les pépites de chocolat, les recettes de biscuits au chocolat, etc. Tiges, variantes, TF-IDF, ce sont toutes des méthodologies plus anciennes pour comprendre en quoi consiste un élément de contenu.

Nous devons plutôt comprendre quelles sont les entités que Google utilise, en utilisant son vaste corpus de connaissances, en utilisant des éléments tels que Freebase, utilisant de grandes parties de l'internet, où Google voit ces entités co-se produire à une vitesse telle qu'elles se sentent raisonnablement convaincues qu'un élément de contenu d'une entité afin d'être saillant à cette entité inclurait ces autres

Le meilleur moyen de créer un contenu pertinent pour un sujet est de faire appel à un expert

Alors, recette de biscuits aux brisures de chocolat, nous nous assurons également d'ajouter du beurre, de la farine et du sucre . C'est en fait très facile à faire si vous avez une recette de biscuits aux pépites de chocolat à mettre en place. C’est à mon sens que ce que nous allons commencer à considérer comme une tendance de contenu dans le référencement est que le meilleur moyen de créer un contenu qui est d’une importance capitale pour un sujet est d’avoir un expert sur ce sujet qui le crée. ]

Une personne ayant une connaissance approfondie d'un sujet va naturellement inclure les termes cooccurrents, car elle sait comment créer quelque chose qui correspond à ce qu'il est supposé être. Je pense que ce que nous allons commencer à voir, c'est que les gens vont devoir commencer à payer davantage pour le marketing de contenu, franchement. Malheureusement, beaucoup d'entreprises semblent penser que le marketing de contenu est et devrait être bon marché.

Les spécialistes du marketing de contenu, je pense que vous en êtes conscient. C'est nul, et ce n'est plus le cas. Nous devons commencer à investir dans le contenu et dans les experts pour créer ce contenu afin qu’ils puissent créer ce contenu profond, riche et remarquable dont tout le monde a réellement besoin.

Comment pouvez-vous utiliser cette API pour améliorer votre propre référencement?

L’une des choses que j’aime faire avec ce type d’information est de regarder – et c’est quelque chose que je fais depuis des années, mais pas dans ce contexte – mais les pages qui classent pour un sujet, mais ils se classent à la page 2.

Cela signifie souvent que Google comprend que ce mot clé est un sujet de la page, mais ne comprend pas nécessairement qu'il s'agit d'un bon contenu sur ce sujet. , que la page traite uniquement de ce contenu, que c'est une bonne ressource. En d'autres termes, le signal est là, mais il est faible.

Ce que vous pouvez faire est de prendre un contenu qui se classe mais ne fonctionne pas bien, de l'exécuter via cette API de langage naturel ou un autre outil de traitement de langage naturel, et Examinez comment les entités sont extraites et comment Google détermine qu'elles sont liées les unes aux autres. Parfois, il se peut que vous deviez faire de la désambiguïsation. Ainsi, dans cet exemple, vous remarquerez que même si les biscuits au chocolat sont appelés œuvres d'art, et je suis d'accord, les biscuits ici s'appellent en réalité autres.

Cela est dû au fait que le terme "biscuit" signifie plus qu'une chose. Il y a les cookies, les produits cuits au four, mais il y a aussi les cookies, le paquet de données. Les deux sont des utilisations légitimes du mot "cookie". Les mots ont plusieurs significations. Si vous remarquez que Google, cette API de traitement de langage naturel ne parvient pas à classer correctement vos entités, c’est un bon moment pour commencer à faire de la désambiguïsation.

Assurez-vous que les termes qui entourent ce terme indiquent clairement «Non, Je parle des produits cuits au four, pas des données logicielles. " C'est un très bon moyen d'augmenter votre visibilité. Regardez si vous avez un score saillant fort pour votre entité principale. Vous seriez surpris du nombre de contenus que vous pouvez brancher sur cet outil, et l'entité la plus saillante n'est encore qu'un 0.01, un 0.14.

Souvent, l'API ressemble à "Je pense que c'est de quoi il s'agit ", mais ce n'est pas sûr. C’est le moment idéal pour publier ce contenu, le rendre plus robuste et rechercher des moyens de rendre ces entités plus faciles à extraire et à établir des relations les unes avec les autres. Cela m'amène à mon deuxième point, qui est mon nouveau truc préféré dans le monde.

Écrire pour des humains et écrire pour des machines, vous pouvez maintenant faire les deux en même temps. Vous n'avez plus à le faire et vous ne l'avez pas vraiment fait depuis longtemps, mais l'idée que vous puissiez créer des mots-clés ou créer du contenu pour Google que les utilisateurs risquent de ne pas voir ou qui importent, est comme suit:

Vous pouvez désormais créer un contenu plus convivial pour Google, car les principes de lisibilité de la machine et de lisibilité humaine se rapprochent de plus en plus.

Conseils pour l'écriture en vue d'une lisibilité humaine et machine:

Réduisez les distances sémantiques! "Title =" Réduisez les distances sémantiques! "Style =" box-shadow: 0 0 10px 0 # 999; border-radius: 20px; "/></figure data-recalc-dims=

Source link

Blog ARC Optimizer

novembre 22, 2019

Meilleur contenu grâce au traitement du langage naturel – Whiteboard Friday

Transcription vidéo

Relations entre les entités, les mots et la façon dont les gens recherchent

Compréhension de la saillance

de la saillance, du contenu et des entités

API de traitement du langage naturel

Un exemple délicieux du fonctionnement de la saillance et des entités

Le meilleur moyen de créer un contenu pertinent pour un sujet est de faire appel à un expert

Comment pouvez-vous utiliser cette API pour améliorer votre propre référencement?

Conseils pour l'écriture en vue d'une lisibilité humaine et machine:

Phrases courtes et simples

Une idée par phrase

Reliez les questions aux réponses

Soyez précis en premier, puis expliquez la nuance

Allez droit au but (n'enterrez pas la lumière)

Évitez le jargon et le "langage marketing"

Organisez vos informations en fonction du parcours de l'utilisateur.

Décomposez les sous-thèmes avec les en-têtes

Mettre en forme les listes avec des puces ou des chiffres

Grammaire et orthographe!

Utilisez ces outils pour comprendre à quel point votre contenu est lisible, compréhensible et compréhensible

Articles similaires

Blog ARC Optimizer

Transcription vidéo

Relations entre les entités, les mots et la façon dont les gens recherchent

Compréhension de la saillance

de la saillance, du contenu et des entités

API de traitement du langage naturel

Un exemple délicieux du fonctionnement de la saillance et des entités

Le meilleur moyen de créer un contenu pertinent pour un sujet est de faire appel à un expert

Comment pouvez-vous utiliser cette API pour améliorer votre propre référencement?

Conseils pour l'écriture en vue d'une lisibilité humaine et machine:

Phrases courtes et simples

Une idée par phrase

Reliez les questions aux réponses

Soyez précis en premier, puis expliquez la nuance

Allez droit au but (n'enterrez pas la lumière)

Évitez le jargon et le "langage marketing"

Organisez vos informations en fonction du parcours de l'utilisateur.

Décomposez les sous-thèmes avec les en-têtes

Mettre en forme les listes avec des puces ou des chiffres

Grammaire et orthographe!

Utilisez ces outils pour comprendre à quel point votre contenu est lisible, compréhensible et compréhensible

Partager :

Articles similaires