Les DSI sont sous pression pour mettre en œuvre des initiatives d’IA qui rendront leur organisation plus compétitive, plus efficace et plus productive.
Pourtant, pour beaucoup, les données constituent autant un obstacle qu’une ressource essentielle. Lors du Gartner’s London Data and Analytics Summit plus tôt cette année, l’analyste principal Wilco Van Ginkel a prédit qu’au moins 30 % des projets genAI seraient abandonnés après validation de principe jusqu’en 2025, la mauvaise qualité des données étant l’une des principales raisons. Lors du même sommet, Roxane Edijlala, directrice analyste principale, a noté que « le fait de disposer de données prêtes pour l’IA entraîne de meilleurs résultats commerciaux de 20 % ».
Le problème est que de nombreuses entreprises ne savent pas exactement comment préparer leurs données. Ils craignent que cela soit onéreux, en particulier pour les organisations sans données internes ni expertise en IA.
Toute organisation qui tente de progresser dans son parcours vers l’IA doit comprendre une vérité fondamentale : l’IA dépend de données de qualité, et les résultats que vous obtenez sont aussi puissants que les données que vous fournissez.
Ces données doivent être bien préparées, faciles à gérer et accessibles dans la gamme des différents environnements dans lesquels vous envisagez de mettre en œuvre les outils genAI. C’est le fondement de l’innovation en matière d’IA, d’une productivité accrue et de nouvelles sources de revenus.
Fondamentaux des données
Pour que les organisations puissent réaliser le potentiel de genAI, elles doivent accéder à toutes les données de l’organisation. Cela ajoute immédiatement de la complexité. Une organisation typique dispose d’énormes quantités de données aux formats physiques et numériques, réparties sur différents systèmes d’entreprise complexes et dans de nombreux silos de données. La première étape consiste donc à créer un inventaire complet, cataloguant toutes vos données, où elles se trouvent et comment elles sont formatées. Cela fournit un point de départ à partir duquel vous pouvez l’organiser.
La deuxième étape consiste à évaluer et à traiter la qualité des données, en établissant des normes clés permettant d’évaluer l’exactitude, l’exhaustivité et la fiabilité des données. Les équipes informatiques peuvent ensuite utiliser ces normes pour identifier ce qui est nécessaire. Cela commence par une transmission unique des données existantes, mais une fois les normes de qualité établies, elles peuvent également être appliquées à toutes les données entrantes, pour former un mécanisme continu d’hygiène des données.
La mise en œuvre d’une gouvernance et d’une sécurité pour ces données est également d’une importance cruciale, car elle garantit qu’elles sont à la fois protégées contre les violations et conformes à la réglementation. Cela nécessite à son tour des outils de gouvernance efficaces et un calendrier de rétention clair. Les données peuvent durer éternellement et passer des années à être introduites dans les outils genAI. Il est donc essentiel de savoir où elles deviennent redondantes ou non pertinentes, sous peine de risquer des résultats de mauvaise qualité.
Enfin, les entreprises doivent s’assurer que leurs données proviennent de sources légales et éthiques, et d’une manière qui respecte la vie privée et la confidentialité, ainsi que tous les droits de propriété intellectuelle pertinents.
Tout cet élément autour de la qualité, de la pertinence, de la gouvernance et de la responsabilité est important, car ce sont des outils puissants qui génèrent des réponses et des informations qui peuvent avoir un réel impact sur votre organisation – et sur la vie des individus. Cela rend cruciale la possibilité de retracer les données jusqu’à leur source.
Erreurs de base
Il existe cependant des pièges qui peuvent gâcher la réussite. Ne pas maintenir un ensemble de données complet et complet en fait partie. Il est essentiel d’adopter une approche unifiée qui couvre à la fois les données structurées et non structurées.
D’après ce que nous constatons chez nos clients, seulement 20 % environ des données dont vous avez besoin pour un cas d’utilisation sont généralement visibles, tandis que 20 % supplémentaires sont ce que nous appelons ROT : redondants, obsolètes ou triviaux. Les 60 % restants ne seront pas structurés, se trouveront dans des documents papier ou seront cachés dans des systèmes cloisonnés.
Une partie de ces 60 % – audio, vidéo, chat – est devenue extrêmement importante car elle couvre les domaines où se déroulent actuellement une grande partie de la communication. Pouvoir l’exploiter est un super pouvoir de la genAI, mais cela ne peut se produire que s’il est visible et accessible.
Par conséquent, l’incapacité d’exploiter des données non structurées limite votre capacité à obtenir des résultats vraiment significatifs. De plus, il vous manque également des informations qui peuvent être utilisées pour entraîner et affiner les algorithmes, et les rendre plus intelligents.
Certaines entreprises font l’erreur de se laisser emporter par l’élan autour de l’IA et de devenir grandes, en essayant de tout faire en même temps. Pourtant, il est en réalité plus logique de faire le contraire. Choisissez un cas d’utilisation dans lequel vous ne disposez pas de trop de sources de données et dans lequel vous ne travaillez pas sur plusieurs formats de données différents.
La voie rapide pour préparer les données à l’IA
Préparer vos données pour l’IA est l’une des principales propositions de valeur de Aperçu d’Iron Mountain® Plateforme d’expérience numérique (DXP). Il rassemble vos données pour une prise de décision intelligente. Il vous aide à créer des flux de travail pour préparer vos données et réaliser leur valeur.
Iron Mountain travaille avec ses clients pour dresser un inventaire complet de leurs données physiques et numériques, afin qu’ils puissent consolider toutes les informations utiles dans un emplacement unique et accessible dans InSight DXP. Cela élimine toute incertitude et garantit que les données sont extraites d’environnements fragmentés vers une source unique.
De plus, une grande partie de cela est réalisée à l’aide de l’IA pour passer au crible vos données, les évaluer et les consolider. Une fois sur place, vous pouvez extraire de la valeur à l’aide du chat propulsé par genAI, vous permettant d’interagir avec vos documents – numériques ou physiques – de manière intuitive, humaine et en temps réel.
Chez Iron Mountain, nous utilisons nous-mêmes InSight DXP pour améliorer nos systèmes de gestion du cycle de vie des contrats (CLM) et rationaliser la saisie des données. Avant InSight DXP, notre équipe opérationnelle extrayait et saisissait manuellement les données contractuelles dans Salesforce et d’autres systèmes, ce qui prenait beaucoup de temps. En automatisant l’extraction de données et l’intégration d’API via InSight DXP, nous avons réduit l’activité manuelle de 65 %.
Gouvernance continue des données
Il est essentiel que les entreprises suivent un rythme continu en ce qui concerne leurs données, plutôt que de considérer le processus comme « une étape terminée ». Cela rend la gouvernance vitale, et cela peut être intimidant sans la bonne technologie.
L’utilisation d’InSight DXP, avec sa suite intégrée de gouvernance de l’information, peut aider à surmonter ce défi. Il fournit également une plate-forme unifiée afin que la manière dont vous recherchez et conservez vos données – ainsi que la manière dont vous évaluez leur qualité – reste soumise aux mêmes règles claires. Les entreprises peuvent créer leurs propres flux de travail, en utilisant les capacités low-code et d’automatisation d’InSight DXP pour garantir la qualité des données et garantir la conformité.
En consacrant du temps à configurer correctement leurs processus, les entreprises peuvent garantir que leurs données restent propres, pertinentes et fiables à l’avenir, et mettre leurs initiatives genAI sur la voie rapide du succès.
Pour en savoir plus sur la préparation à l’IA avec Iron Mountain InSight DXP, visitez www.ironmountain.com/insight.
septembre 12, 2024
Des données de qualité sont la base du succès de la genAI : comment les organisations peuvent-elles traiter et préparer leurs données ?
Les DSI sont sous pression pour mettre en œuvre des initiatives d’IA qui rendront leur organisation plus compétitive, plus efficace et plus productive.
Pourtant, pour beaucoup, les données constituent autant un obstacle qu’une ressource essentielle. Lors du Gartner’s London Data and Analytics Summit plus tôt cette année, l’analyste principal Wilco Van Ginkel a prédit qu’au moins 30 % des projets genAI seraient abandonnés après validation de principe jusqu’en 2025, la mauvaise qualité des données étant l’une des principales raisons. Lors du même sommet, Roxane Edijlala, directrice analyste principale, a noté que « le fait de disposer de données prêtes pour l’IA entraîne de meilleurs résultats commerciaux de 20 % ».
Le problème est que de nombreuses entreprises ne savent pas exactement comment préparer leurs données. Ils craignent que cela soit onéreux, en particulier pour les organisations sans données internes ni expertise en IA.
Toute organisation qui tente de progresser dans son parcours vers l’IA doit comprendre une vérité fondamentale : l’IA dépend de données de qualité, et les résultats que vous obtenez sont aussi puissants que les données que vous fournissez.
Ces données doivent être bien préparées, faciles à gérer et accessibles dans la gamme des différents environnements dans lesquels vous envisagez de mettre en œuvre les outils genAI. C’est le fondement de l’innovation en matière d’IA, d’une productivité accrue et de nouvelles sources de revenus.
Fondamentaux des données
Pour que les organisations puissent réaliser le potentiel de genAI, elles doivent accéder à toutes les données de l’organisation. Cela ajoute immédiatement de la complexité. Une organisation typique dispose d’énormes quantités de données aux formats physiques et numériques, réparties sur différents systèmes d’entreprise complexes et dans de nombreux silos de données. La première étape consiste donc à créer un inventaire complet, cataloguant toutes vos données, où elles se trouvent et comment elles sont formatées. Cela fournit un point de départ à partir duquel vous pouvez l’organiser.
La deuxième étape consiste à évaluer et à traiter la qualité des données, en établissant des normes clés permettant d’évaluer l’exactitude, l’exhaustivité et la fiabilité des données. Les équipes informatiques peuvent ensuite utiliser ces normes pour identifier ce qui est nécessaire. Cela commence par une transmission unique des données existantes, mais une fois les normes de qualité établies, elles peuvent également être appliquées à toutes les données entrantes, pour former un mécanisme continu d’hygiène des données.
La mise en œuvre d’une gouvernance et d’une sécurité pour ces données est également d’une importance cruciale, car elle garantit qu’elles sont à la fois protégées contre les violations et conformes à la réglementation. Cela nécessite à son tour des outils de gouvernance efficaces et un calendrier de rétention clair. Les données peuvent durer éternellement et passer des années à être introduites dans les outils genAI. Il est donc essentiel de savoir où elles deviennent redondantes ou non pertinentes, sous peine de risquer des résultats de mauvaise qualité.
Enfin, les entreprises doivent s’assurer que leurs données proviennent de sources légales et éthiques, et d’une manière qui respecte la vie privée et la confidentialité, ainsi que tous les droits de propriété intellectuelle pertinents.
Tout cet élément autour de la qualité, de la pertinence, de la gouvernance et de la responsabilité est important, car ce sont des outils puissants qui génèrent des réponses et des informations qui peuvent avoir un réel impact sur votre organisation – et sur la vie des individus. Cela rend cruciale la possibilité de retracer les données jusqu’à leur source.
Erreurs de base
Il existe cependant des pièges qui peuvent gâcher la réussite. Ne pas maintenir un ensemble de données complet et complet en fait partie. Il est essentiel d’adopter une approche unifiée qui couvre à la fois les données structurées et non structurées.
D’après ce que nous constatons chez nos clients, seulement 20 % environ des données dont vous avez besoin pour un cas d’utilisation sont généralement visibles, tandis que 20 % supplémentaires sont ce que nous appelons ROT : redondants, obsolètes ou triviaux. Les 60 % restants ne seront pas structurés, se trouveront dans des documents papier ou seront cachés dans des systèmes cloisonnés.
Une partie de ces 60 % – audio, vidéo, chat – est devenue extrêmement importante car elle couvre les domaines où se déroulent actuellement une grande partie de la communication. Pouvoir l’exploiter est un super pouvoir de la genAI, mais cela ne peut se produire que s’il est visible et accessible.
Par conséquent, l’incapacité d’exploiter des données non structurées limite votre capacité à obtenir des résultats vraiment significatifs. De plus, il vous manque également des informations qui peuvent être utilisées pour entraîner et affiner les algorithmes, et les rendre plus intelligents.
Certaines entreprises font l’erreur de se laisser emporter par l’élan autour de l’IA et de devenir grandes, en essayant de tout faire en même temps. Pourtant, il est en réalité plus logique de faire le contraire. Choisissez un cas d’utilisation dans lequel vous ne disposez pas de trop de sources de données et dans lequel vous ne travaillez pas sur plusieurs formats de données différents.
La voie rapide pour préparer les données à l’IA
Préparer vos données pour l’IA est l’une des principales propositions de valeur de Aperçu d’Iron Mountain® Plateforme d’expérience numérique (DXP). Il rassemble vos données pour une prise de décision intelligente. Il vous aide à créer des flux de travail pour préparer vos données et réaliser leur valeur.
Iron Mountain travaille avec ses clients pour dresser un inventaire complet de leurs données physiques et numériques, afin qu’ils puissent consolider toutes les informations utiles dans un emplacement unique et accessible dans InSight DXP. Cela élimine toute incertitude et garantit que les données sont extraites d’environnements fragmentés vers une source unique.
De plus, une grande partie de cela est réalisée à l’aide de l’IA pour passer au crible vos données, les évaluer et les consolider. Une fois sur place, vous pouvez extraire de la valeur à l’aide du chat propulsé par genAI, vous permettant d’interagir avec vos documents – numériques ou physiques – de manière intuitive, humaine et en temps réel.
Chez Iron Mountain, nous utilisons nous-mêmes InSight DXP pour améliorer nos systèmes de gestion du cycle de vie des contrats (CLM) et rationaliser la saisie des données. Avant InSight DXP, notre équipe opérationnelle extrayait et saisissait manuellement les données contractuelles dans Salesforce et d’autres systèmes, ce qui prenait beaucoup de temps. En automatisant l’extraction de données et l’intégration d’API via InSight DXP, nous avons réduit l’activité manuelle de 65 %.
Gouvernance continue des données
Il est essentiel que les entreprises suivent un rythme continu en ce qui concerne leurs données, plutôt que de considérer le processus comme « une étape terminée ». Cela rend la gouvernance vitale, et cela peut être intimidant sans la bonne technologie.
L’utilisation d’InSight DXP, avec sa suite intégrée de gouvernance de l’information, peut aider à surmonter ce défi. Il fournit également une plate-forme unifiée afin que la manière dont vous recherchez et conservez vos données – ainsi que la manière dont vous évaluez leur qualité – reste soumise aux mêmes règles claires. Les entreprises peuvent créer leurs propres flux de travail, en utilisant les capacités low-code et d’automatisation d’InSight DXP pour garantir la qualité des données et garantir la conformité.
En consacrant du temps à configurer correctement leurs processus, les entreprises peuvent garantir que leurs données restent propres, pertinentes et fiables à l’avenir, et mettre leurs initiatives genAI sur la voie rapide du succès.
Pour en savoir plus sur la préparation à l’IA avec Iron Mountain InSight DXP, visitez www.ironmountain.com/insight.
Source link
Partager :
Articles similaires