Tirer le meilleur parti des données d’entreprise est une préoccupation majeure des responsables informatiques d’aujourd’hui. Alors que les organisations cherchent à prendre des décisions commerciales davantage basées sur les données, les responsables informatiques doivent concevoir une stratégie de données qui crée de la valeur à partir des données, peu importe où elles se trouvent et sous quelle forme.
Pour de nombreuses entreprises, les données non structurées sous forme de texte, vidéo, audio, réseaux sociaux, images, capteurs et autres formes restent insaisissables et inexploitées. Selon Foundry Research, une étude du secteur estime que 90 % des données d’entreprise sont non structurées, mais 61 % des responsables informatiques déclarent que la gestion des données non structurées est un problème pour leur organisation. Et 24 % supplémentaires n’incluent pas les données non structurées dans leur liste restreinte de données et d’analyses. .
Les ressources de données non structurées sont extrêmement précieuses pour obtenir des informations commerciales et résoudre des problèmes. La clé est de trouver un moyen de créer cette valeur. Les organisations qui savent exploiter ces vastes ressources d’informations ont un avantage significatif en fournissant des informations exploitables sur les processus métier clés.
Voici comment des entreprises inventives transforment les données non structurées en valeur commerciale, ainsi que des conseils pour exploiter les données non structurées pour votre organisation.
Améliorez votre processus créatif
Chez le développeur de jeux mobiles Retrostyle Games, les données non structurées se sont révélées être une « mine d’or » qui contribue directement à la croissance de l’entreprise et à l’amélioration des jeux, explique Ivan Konoval, analyste de données au sein de l’entreprise.
Retrostyle Games utilise des données non structurées de nombreuses manières, mais la plus efficace réside peut-être dans la collecte d’art conceptuel et de données audio.
« Le processus créatif d’un développeur de jeux commence souvent par des croquis, des mood boards et des illustrations conceptuelles. Ces pièces ne sont pas structurées, mais capturent l’essence de ce qu’ils veulent que le jeu exprime. « Nous utilisons des outils avancés de reconnaissance d’images pour garantir que votre travail ne fonctionne pas. Je ne me perdrai pas parmi d’autres travaux et je pourrai facilement le retrouver dans les futures suites du jeu », explique Konoval.
Ces outils catégorisent et étiquetent divers éléments d’œuvres d’art, tels que les personnages et les décors. « Cela permet à nos artistes et développeurs de trouver rapidement des œuvres d’art pertinentes, garantissant ainsi la cohérence de la conception et accélérant le processus de développement », explique Konoval. « De plus, ce système nous permet de stocker des informations sur l’évolution des créations de l’entreprise, ce qui est extrêmement utile lors de la formation des nouveaux employés. »
En ce qui concerne les données audio, Konoval affirme que les acteurs vocaux jouent un rôle important dans l’expérience du joueur dans le monde du jeu. « Nous collectons de grandes quantités de données à partir des dialogues en jeu, des sons de fond et du chat vocal des joueurs. Nous utilisons la reconnaissance vocale et l’analyse sonore pour extraire des nuances telles que l’humeur et l’émotion. »
Par exemple, si un certain dialogue amène les joueurs à s’enthousiasmer constamment et à entrer dans le chat vocal, les développeurs doivent en prendre note. De même, les anomalies telles que le bruit de fond qui ne correspondent pas à l’environnement sont identifiées et traitées.
« Les informations tirées de ces données audio contribuent directement à améliorer l’expérience audio dans les jeux, en garantissant que les joueurs sont toujours émotionnellement immergés dans le jeu et interagissent avec l’environnement », a déclaré Konoval.
Les jeux sont dynamiques, explique Konoval, tout comme les données qu’ils génèrent. Des fonctionnalités telles que l’analyse des sentiments du chat dans le jeu nécessitaient un traitement en temps réel pour filtrer les comportements inappropriés des joueurs. « Nous avons résolu ce problème en tirant parti de frameworks de traitement de flux comme Apache Kafka. Cela permet aux modérateurs de jeux de répondre aux modèles et problèmes émergents en temps réel.
À chaque sortie ou mise à jour du jeu, la quantité de données non structurées traitées augmente de façon exponentielle, a déclaré Konoval. « Cette quantité de données pose de sérieux problèmes en termes de stockage et de traitement efficace. »
Pour résoudre ce problème, Retrostyle Games a investi dans un lac de données. « Cela nous permet non seulement de stocker de grandes quantités de données non structurées, mais également de les interroger et de les analyser efficacement, donnant ainsi aux scientifiques et aux développeurs un accès instantané aux informations dont ils ont besoin », explique-t-il.
Renforcer l’IA générative
Workhuman, un fournisseur de logiciels de reconnaissance et d’expérience des employés, exploite les données non structurées de diverses manières sur sa plateforme cloud.
« Les données non structurées constituent la forme de données la plus courante, mais aussi la plus difficile à utiliser efficacement », explique Harriott.
Le cloud de Workhuman stocke des millions de messages de remerciement d’employés du monde entier, partageant des commentaires positifs sur une personne avec laquelle ils travaillent.
« Ils le font selon leurs propres conditions, donc chaque moment de reconnaissance est complètement unique », explique Harriott. « Nous utilisons ces données pour créer des modèles d’IA afin de comprendre comment les employés collaborent au sein de l’organisation, quels sujets reviennent le plus souvent dans les messages et reconnaître la reconnaissance au sein de l’organisation. Cela permet aux entreprises de définir plus clairement si l’équité est maintenue. «
La société utilise également des modèles linguistiques à grande échelle (LLM) pour résumer les tendances en matière de récompenses au fil du temps et suggérer une formulation efficace des messages de récompense.
«Une initiative dont je suis particulièrement fier est un outil appelé Inclusion Advisor, un outil de coaching basé sur l’IA qui identifie les préjugés inconscients dans les déclarations de reconnaissance avant qu’elles ne soient envoyées aux lauréats, suggérant des modifications», déclare Harriott.
L’un des plus grands défis pour extraire de la valeur des données non structurées est que les organisations ont un accès limité à des données de formation fiables et valides pour leurs cas d’utilisation métier principaux.
« Même avec de grandes quantités de données non structurées, les progrès et la qualité en souffriront si vous ne disposez pas de données de formation efficaces pour créer et valider vos modèles », explique Harriott. « Tirer parti du LLM peut certainement aider à cet égard, mais de nombreux cas d’utilisation commerciale ne peuvent pas être efficacement capturés avec le LLM existant.
De plus, « avec LLM, il peut toujours y avoir des problèmes de biais dans les données de formation », explique Harriott. Workhuman dispose d’une équipe linguistique chargée d’annoter, d’enrichir et de valider les données pour répondre à ces problématiques. « Nous travaillons également en partenariat avec de grands clients multinationaux pour garantir que nos modèles produisent des résultats significatifs et utiles », explique Harriott.
Conseils pour transformer les données non structurées en valeur
Des experts en données comme Harriott et Konoval offrent des conseils pour réussir lorsque vous travaillez avec des données non structurées :
1. Reliez les initiatives aux résultats commerciaux.Les responsables informatiques doivent s’assurer que les initiatives qui exploitent des données non structurées sont étroitement alignées sur les besoins de l’entreprise et bénéficient du parrainage de la direction, explique Harriott.
« Les équipes ont souvent des cas d’utilisation créatifs de données non structurées qui ne sont plus appréciées car le lien avec des résultats commerciaux importants n’est pas clair », explique Harriott. « Il est de la responsabilité des dirigeants d’éduquer l’organisation sur les raisons pour lesquelles ce cas d’utilisation est important et comment il apporte directement ou indirectement des avantages commerciaux. »
2. Reconnaissez le processus.Les responsables des données doivent également considérer à quel point il est difficile de créer de la valeur avec des données non structurées, fixer des jalons pour leurs initiatives et célébrer ce qui a été accompli.
« Rendre les données non structurées exploitables peut nécessiter plus de temps et d’efforts que ce à quoi l’entreprise s’attend », explique Harriott. « En reconnaissant les jalons, les dirigeants peuvent rendre les progrès visibles aux autres parties prenantes et aider les membres de l’équipe à se sentir valorisés pour le niveau d’effort qu’ils déploient pour rendre les données non structurées exploitables. »
3. La qualité passe avant tout.Une autre clé du succès consiste à donner la priorité à la qualité des données.
Konoval dit qu’il n’y a rien de mieux que l’adage « garbage in, garbage out ». » Se lancer dans l’analyse sans garantir la qualité des données peut être contre-productif. Notre approche a toujours été de nettoyer les données, de supprimer les éléments inutiles et de nous assurer qu’elles répondent aux normes de qualité. «
Dans l’industrie du jeu vidéo, explique Konoval, « des décisions mal informées peuvent conduire à un développement coûteux de fonctionnalités qui ne plaisent pas aux joueurs, ou pire encore, à des bugs préjudiciables à leur réputation ». « Notre cadre rigoureux de gouvernance des données garantit que la base de nos analyses est solide comme le roc. »
4. Séparez les données exploitables des données utiles.Il est également important de donner la priorité aux données sur lesquelles les utilisateurs professionnels peuvent agir. « La clé est de déterminer la quantité de données dont vous disposez, ce qui est pratique et ce qui est bénéfique », déclare Joe Minarik, COO de DataBank, un fournisseur de services de données de colocation.
Pour souligner cette importance, Minarik utilise l’exemple de l’utilisation de données non structurées pour la surveillance du système. « Les aspects pratiques doivent être priorisés et traités rapidement. Avec autant d’aspects du système surveillés, un seul problème peut déclencher des alarmes et des informations provenant d’équipements en aval et des alertes. , les alarmes et les informations seront inondées. »
5. Tirez pleinement parti de l’IA.Minarik souligne le rôle précieux que jouent l’IA et l’apprentissage automatique dans l’analyse des flux de données non structurés au fil du temps. « Cela vous aide à établir des corrélations dans le système, ce qui vous permet de filtrer le bruit et d’identifier rapidement la racine du problème. »
Par exemple, les organisations peuvent mettre en œuvre la reconnaissance d’entités nommées (NER). NER est un composant du traitement du langage naturel (NLP) qui se concentre sur l’identification et la classification des entités nommées dans un texte non structuré, en les étiquetant comme « personnes », « organisations », « lieux », etc.
« En pratique, la reconnaissance d’entités joue un rôle important dans de nombreuses applications », explique Minarik. Il s’agit notamment de systèmes de recherche d’informations qui indexent et organisent le contenu, de systèmes de questions-réponses qui trouvent des réponses dans le texte, de moteurs de recommandation de contenu qui personnalisent le contenu en fonction d’entités reconnues, et bien plus encore.
« En identifiant et en classant les entités nommées, NER permet aux analystes de données et aux ingénieurs système d’extraire des informations précieuses à partir des vastes quantités de données collectées », explique Minarik.
6. Garantissez la valeur grâce à la visibilité.Le processus visant à rendre utilisables les données non structurées ne s’arrête pas à l’analyse, explique Minarik. Cela aboutit à la communication et à la communication des résultats de la recherche.
« Les rapports comprennent généralement une présentation structurée des principales conclusions, de la méthodologie et des implications de l’analyse », explique Minarik. « Les visualisations telles que les diagrammes, les graphiques et les tableaux de bord aident à communiquer des données complexes dans un format facile à comprendre. Les représentations visuelles facilitent non seulement la compréhension, mais aident également les parties prenantes à identifier les tendances, les valeurs aberrantes, facilitent l’identification des informations clés et fournissent en temps opportun, décisions basées sur les données.
7. Surveillez pendant que vous avancez.Une autre pratique importante qui est parfois négligée est la nécessité d’une surveillance et d’une maintenance continues, explique Minarik. « Les données du monde réel sont dynamiques et en constante évolution. Une surveillance et une maintenance continues sont essentielles pour garantir que les données restent utilisables au fil du temps. »
Selon Minarik, la clé pour y parvenir est d’effectuer régulièrement un nettoyage et des contrôles de qualité afin de maintenir l’exactitude et la fiabilité des données. Les anomalies, incohérences et duplications de données doivent être rapidement identifiées et corrigées pour éviter des analyses faussées ou incorrectes.
8. Aiguisez les compétences de votre équipe.Enfin, il est de bonne pratique d’investir dans le développement des compétences appropriées. Cet effort doit être continu, étant donné que les outils sous-jacents évoluent constamment.
« Le monde de l’analyse des données, en particulier des données non structurées, est dynamique. Un petit avantage, comme la dernière technologie de reconnaissance d’images ou une équipe compétente dans l’analyse des concepts artistiques, peut faire la différence entre un jeu qui est un succès ou un échec. Nous’ Nous voyons déjà comment les résultats technologiques avancés ont un impact sur la narration et la conception des jeux, conduisant à des retours positifs et à un engagement accru des joueurs. » (Konoval)
Analytique
Source link