Assurer la préparation à l’IA grâce à la gestion sécurisée des informations (SIM)

Selon McKinsey, l’utilisation de l’IA générative en entreprise pourrait générer entre 2 600 et 4 400 milliards de dollars par an dans plus de 60 cas d’utilisation. En plus, Accenture a analysé 12 économies développées et a découvert que l’IA a le potentiel de doubler leur taux de croissance économique annuel d’ici 2035.
Compte tenu de ces projections impressionnantes, il est clair que l’IA, en particulier les grands modèles linguistiques (LLM), est en passe de révolutionner de nombreux secteurs. Les LLM peuvent rédiger des e-mails, générer du contenu créatif, aider au codage et fournir un support client, entre autres. Par exemple, dans une étude du Bureau national de recherche économiqueles agents du support client utilisant les outils d’IA générative ont constaté une augmentation de 13,8 % du nombre de problèmes clients résolus par heure.
Bien que les capacités des LLM soient impressionnantes, leur adoption généralisée comporte des risques importants. Comprendre ces vulnérabilités est crucial pour les entreprises qui cherchent à exploiter la puissance de l’IA de manière responsable.
Les risques de l’IA générative
Les grands modèles linguistiques (LLM) sont confrontés à des vulnérabilités spécifiques qui peut permettre aux acteurs malveillants d’extraire des informations personnellement identifiables (PII) grâce à des attaques ciblées sur les vastes ensembles de données sur lesquels ces modèles sont formés.
Exemple concret :
En mars 2023, une vulnérabilité dans la bibliothèque Redis utilisée par ChatGPT a entraîné une violation de données, exposant des informations utilisateur sensibles. La violation a permis à certains utilisateurs de consulter l’historique des discussions et les détails de paiement d’autres utilisateurs actifs, notamment les noms, les adresses e-mail et des informations partielles sur la carte de crédit.
Les acteurs menaçants peuvent également exploiter Susceptibilité des LLM aux biais dans leurs données de formation. Cela peut avoir de profondes conséquences, car les résultats biaisés de l’IA peuvent conduire à des pratiques d’embauche discriminatoires, à des approbations de prêts injustes ou à la propagation de fausses informations.
Compte tenu de ces risques importants, les entreprises doivent adopter des mesures complètes de protection des données pour protéger les informations sensibles. C’est là que la gestion sécurisée des informations (SIM) joue un rôle crucial. En mettant en œuvre des processus rigoureux de gouvernance des données et de formation à la désinfection des données, SIM garantit que les entreprises peuvent atténuer efficacement ces risques.
Qu’est-ce que la gestion sécurisée des informations ?
SIM se concentre sur la sécurité des informations sensibles (contenus tels que documents, fichiers, dossiers cloud, etc.) lorsqu’elles sont utilisées, en transit et au repos. Il applique également la gouvernance des données grâce à la vérification de l’identité et aux contrôles d’accès. En utilisant des politiques pour découvrir et classer les données en fonction de leur sensibilité, SIM garantit la confidentialité des données tout au long de leur cycle de vie.
La mise en œuvre de SIM est essentielle pour gérer la sécurité des données tout au long de leur cycle de vie. Mais comment SIM améliore-t-il les pratiques de gestion de données existantes telles que la gestion du cycle de vie des données (DLM) ?
Gestion sécurisée des informations et gestion du cycle de vie des données
La gestion du cycle de vie des données (DLM) gère les données de leur création à leur suppression, en passant par le stockage, la sauvegarde, l’archivage et la suppression. Gestion sécurisée des informations (SIM) améliore DLM avec cryptage, contrôle d’accès et audits, garantissant l’intégrité des données, la conformité, l’atténuation des risques, le stockage sécurisé et la disponibilité, renforçant ainsi l’efficacité de DLM.
Les avantages business de la SIM
- Visibilité: Fournit une visibilité en temps réel sur les événements et incidents de sécurité des données. Cette approche proactive réduit considérablement le risque de violation de données, contribuant ainsi à maintenir et à protéger la réputation de la marque.
- Conformité: Permet aux organisations de se conformer aux exigences réglementaires telles que CCPA, HIPAA, GLBA, GDPR, ainsi qu’aux réglementations émergentes orientées vers l’IA. Rien que l’année dernière, le Le nombre total de réglementations liées à l’IA aux États-Unis a augmenté de 56,3 %.
- Automatisation: En automatisant la surveillance de la sécurité des données et la réponse aux incidents, SIM aide les équipes informatiques et de sécurité à se concentrer sur des initiatives plus stratégiques, stimulant ainsi la croissance de l’entreprise.
- Confidentialité des données: SIM assure la protection des informations personnelles des clients, évitant ainsi des amendes coûteuses, des poursuites et la perte de clients.
L’importance du nettoyage et de la protection des données
Les informations personnelles et les données sensibles peuvent se retrouver par inadvertance dans des ensembles de données de formation pour les LLM via des sources telles que le web scraping, les médias sociaux, le contenu généré par les utilisateurs, les référentiels de codes et les articles universitaires. Les acteurs malveillants peuvent alors exploiter diverses méthodes pour extraire ces données. Par exemple, les chercheurs ont démontré une « attaque de divergence » incitant ChatGPT à afficher à plusieurs reprises le mot « poème », cela a conduit à l’extraction de plus de 10 000 exemples de formation mémorisés uniques, y compris des adresses e-mail et des numéros de téléphone. Cette simple commande a amené ChatGPT à s’écarter de ses réponses alignées, entraînant la publication inattendue de données d’entraînement. Notamment, 16,9 % des sorties LLM testées contenaient des informations personnelles mémorisées.
Pour atténuer ces risques, il est crucial de mettre en œuvre les éléments suivants :
- Découverte et classification automatisées des données: utilisez l’analyse automatisée et l’apprentissage automatique pour identifier et classer les informations personnelles dans diverses sources de données.
- Désinfection des données: effacez ou protégez soigneusement les données de formation à l’aide du cryptage, du masquage ou de la tokenisation avant la formation LLM.
- Minimisation des données : Ccollecter, traiter et stocker uniquement le minimum de données sensibles nécessaires, garantissant ainsi la confidentialité, la sécurité et le respect des normes juridiques et éthiques. Cela réduit également les coûts de stockage et soutient les politiques vertes.
- Gestion des politiques et contrôles d’accès: Créez des politiques de gestion des données personnalisées, appliquez des contrôles d’accès et auditez régulièrement les sorties LLM.
- Les avantages commerciaux de ces stratégies incluent un délai de monétisation plus rapide grâce à l’utilisation de données propres et prêtes pour l’IA et le maintien de la confidentialité des données et de la confiance des clients grâce à l’atténuation des risques.
Évaluation de l’impact commercial potentiel de la découverte et de la classification des données
Toutes les données ne sont pas créées égales. Selon le rapport IBM Cost of Data Breach Report 2023, les principales catégories d’enregistrements compromis incluent les informations personnelles des clients avec un coût moyen de 183 USD par enregistrement, les informations personnelles des employés coûtant 181 USD et même les informations personnelles non personnelles coûtant 138 USD. C’est là qu’intervient la modélisation des risques :
- Étant donné que les modèles traditionnels de coûts des violations de données sont insuffisants, modélisation avancée des risques financiers est essentiel pour capturer avec précision la variabilité et la gravité des impacts financiers potentiels des violations de données.
- La modélisation avancée des risques financiers implique l’utilisation de modèles complexes et nuancés pour aider les organisations à mieux gérer et atténuer ces risques.
Conclusion : l’impératif d’une gestion sécurisée de l’information dans l’adoption de l’IA
En conclusion, adopter la gestion sécurisée des informations (SIM) parallèlement à la gestion du cycle de vie des données (DLM) ne consiste pas seulement à atténuer les risques, mais également à exploiter l’IA à son plein potentiel. En adoptant ces pratiques, les entreprises peuvent garantir la conformité réglementaire, préserver la confidentialité des données, renforcer la confiance des clients et atteindre une croissance soutenue à l’ère de l’IA.
OpenText se distingue comme un leader dans le domaine des cartes SIM, en fournissant des solutions complètes intégrant la sécurité des données, la gestion des identités et des accès pour aider les entreprises à se préparer à l’IA. Pour plus d’informations, consultez notre Fusion de tension OpenText (Sécurité des données) et Gestion des identités et des accès OpenText pages.
Source link