Fermer

septembre 12, 2024

Préparez vos données pour l’IA | DSI

Préparez vos données pour l’IA | DSI



Pour la plupart des organisations, l’utilisation efficace de l’IA est essentielle à leur viabilité future et nécessite, à son tour, de grandes quantités de données précises et accessibles. Dans tous les secteurs, 78% des dirigeants considèrent le développement des cas d’utilisation de l’IA et du machine learning (ML) pour créer de la valeur commerciale comme leur priorité absolue au cours des trois prochaines années.

Pourtant, les organisations ont besoin d’aide pour faire évoluer l’IA et faire passer les applications du pilote à la production. La raison principale est qu’il est difficile et long de consolider, traiter, étiqueter, nettoyer et protéger les informations à grande échelle pour former des modèles d’IA. Les données organisationnelles sont diverses, massives et existent sous de multiples formats (papier, images, audio, vidéo, e-mails et autres types de données non structurées, ainsi que données structurées) réparties sur plusieurs sites et silos. Les DSI doivent résoudre ces défis pour que l’organisation soit prête à l’IA et débloquer l’innovation.

Avantages tangibles de l’IA

Résoudre ces défis est essentiel pour réaliser les avantages que l’IA produit dans des cas d’utilisation réels. Les résultats de trois organisations permettent de constater facilement la valeur transformatrice de l’IA :

  • Une agence gouvernementale européenne chargée de distribuer les retraites utilise l’IA pour réduire le délai de paiement de plus de deux ans à quelques semaines.
  • Un fournisseur de moteurs d’avion utilise l’IA pour gérer des milliers de documents techniques requis pour la certification des moteurs, réduisant ainsi le temps d’administration de 3 à 6 mois à quelques semaines.
  • Une agence média exploite l’IA générative pour extraire des informations sur les droits d’auteur et les détails de propriété sur 20 millions d’images et des milliers de films et d’épisodes télévisés, réduisant ainsi la prise de décision de plusieurs mois à quelques heures.

Les exemples ci-dessus démontrent comment l’expansion des applications d’IA et des données non structurées contribue à créer des résultats transformationnels. De toute évidence, l’afflux de données non structurées utilisées par les organisations dans les modèles d’IA a généré de nouvelles opportunités et de nouveaux défis dans la préparation des données (et des organisations) à l’IA.

Tout parcours vers l’IA commence par une base de données adéquate, sans doute l’étape la plus difficile. Parmi les DSI interrogés, 72% affirment que les problèmes liés aux données sont le facteur le plus susceptible de compromettre la réalisation de leurs objectifs en matière d’IA. Examinons quatre principes nécessaires pour préparer vos informations à l’IA.

Rendre vos données prêtes pour l’IA

Données d’inventaire et de catalogue

Les organisations stockent d’énormes quantités de données physiques et numériques qui peuvent ou non être utiles à l’IA. Une estimation révèle que 64% des organisations gèrent au moins un pétaoctet de données, et 41 % des organisations dépassent ce chiffre avec au moins 500 pétaoctets de données. Mais ces données se trouvent dans des systèmes disparates, des silos et des formats variés, ce qui empêche les organisations de réaliser tout leur potentiel. De nombreuses organisations n’ont pas leurs données cataloguées et ne comprennent pas quelles données sont pertinentes pour leur stratégie d’IA et prêtes à être utilisées.

Réalisez un inventaire complet des données de votre organisation sur tous les systèmes, sources et formats, y compris structurés, non structurés, numériques et physiques. Avec un inventaire bien organisé, vous pouvez prendre les bonnes décisions quant aux informations qui doivent être conservées, détruites de manière justifiable ou numérisées. Pour y parvenir, il faut un ensemble intégré d’outils et de capacités qui Aperçu d’Iron Mountain Plateforme d’expérience numérique (DXP) fournit dans une seule solution unifiée. InSight DXP offre des fonctionnalités permettant d’évaluer et de gérer la qualité des données grâce au traitement intelligent des documents (IDP), de mettre en œuvre une gouvernance et une sécurité avec des fonctionnalités intégrées pour répondre aux obligations de conservation et de confidentialité, et d’une gestion de contenu robuste avec un suivi d’audit de bout en bout pour garantir que les données sont traitées de manière responsable. .

Évaluer et traiter la qualité des données

Une fois vos données centralisées et cataloguées, il est crucial d’évaluer et de répondre aux normes de qualité des données. En effet, la sortie du modèle d’IA est aussi précise que les données entrées. Pour confirmer l’exactitude des données, les flux de travail IDP peuvent extraire des informations pour les soumettre à une validation et une vérification. Les systèmes IDP comparent les données extraites à des règles, bases de données ou documents de référence prédéfinis pour valider leur exactitude. Toutes les divergences ou erreurs sont signalées pour examen et résolution manuels. Ce processus maintient une bonne hygiène des données et est crucial pour le succès à long terme de l’IA et la résilience des données.

Mettre en œuvre la gouvernance et la sécurité

Aborder la qualité des données peut fournir des garde-fous pour ensuite se concentrer sur des stratégies de gouvernance et de sécurité garantissant que les données sont utilisées de manière appropriée, protégées contre les violations et conformes aux réglementations telles que le Règlement général sur la protection des données (RGPD). La mise en œuvre d’un calendrier de conservation des données définit les exigences juridiques, opérationnelles et de conformité d’une organisation. Il aide les employés à déterminer pendant combien de temps conserver les dossiers, quel que soit leur format, à des fins juridiques et opérationnelles, et quand il est temps de les examiner ou de les éliminer. Les réglementations industrielles et législatives évoluent constamment, nombre d’entre elles édictant des règles plus strictes sur la manière dont les entreprises gèrent leurs informations. Les données organisées et accessibles facilitent la mise en conformité et soutiennent les obligations réglementaires, juridiques et de confidentialité en cours, ainsi que les contrôles d’accès à la sécurité des données.

Sourcer les données de manière responsable

L’approvisionnement en données de manière responsable signifie acquérir et utiliser les données d’une manière éthique, légale et respectueuse de la vie privée et des droits de propriété intellectuelle. Cela implique de se conformer aux lois en vigueur, d’obtenir un consentement éclairé, de garantir la confidentialité et la sécurité des données, de maintenir l’exactitude des données et d’être transparent sur les sources et l’utilisation des données. Cela nécessite également de respecter la propriété intellectuelle, de prendre en compte les implications éthiques pour éviter les préjudices et les préjugés, et d’être responsable de la résolution de tout problème pouvant survenir. En adhérant à ces principes, les organisations peuvent garantir des pratiques responsables et éthiques en matière de données.

Vous êtes un pas de plus vers la préparation à l’IA

Les données sont un atout organisationnel. En rendant vos informations accessibles et utilisables, vous vous préparez à libérer tout le potentiel de vos données pour les utiliser dans les modèles d’IA. Même si le parcours vers l’IA à grande échelle n’est pas simple, il en vaut la peine et fournit une compétence essentielle. Iron Mountain s’engage à aider les organisations dans leur transition vers la préparation aux données et l’IA, en quête d’un avenir meilleur et plus fort pour tous.

Apprendre encore plus à propos d’InSight DXP et de la façon dont il permet de rendre vos données prêtes pour l’IA.




Source link