Fermer

janvier 6, 2024

Peser le risque et la récompense avec la sélection des fournisseurs de génération AI

Peser le risque et la récompense avec la sélection des fournisseurs de génération AI



De plus, pour les informations et données commerciales particulièrement sensibles, il s’attend à voir encore plus de sécurité. « Le fournisseur doit nous offrir la possibilité de créer la solution d’IA chez notre propre locataire », dit-il.

De nombreuses entreprises placent déjà la cybersécurité et la confidentialité des données en tête ou en tête de leur liste de contrôle lors de la sélection de leurs fournisseurs, qu’ils soient IA ou non. Et dans les secteurs réglementés, les fournisseurs doivent également se conformer à des réglementations spécifiques, telles que HIPAA ou PCI.

La même approche peut être étendue pour inclure les fournisseurs, produits et services d’IA générative, mais il y a quelques nouveautés. Par exemple, les entreprises devraient déjà se demander quel type d’audits de sécurité et de normes les fournisseurs mettent en place dans leurs environnements cloud, déclare Arun Chandrasekaran, analyste chez Gartner.

Désormais, avec l’IA générative, ils devraient également s’interroger sur les mesures prises par les fournisseurs pour garantir que les données restent privées et ne soient pas utilisées pour former et enrichir leurs modèles, dit-il.

« Comment les données d’invite sont-elles stockées dans leur environnement ? » il demande. « Puis-je l’exécuter dans mon propre cloud virtuel ? »

Megan Amdahl, vice-présidente directrice des alliances et des opérations avec les partenaires chez Insight, un intégrateur de solutions basé en Arizona, affirme que son entreprise évalue les fournisseurs d’IA générative à la fois pour un usage interne et pour le compte de ses clients.

Insight dispose d’une équipe de gestion des contrats partenaires qui examine de près les accords avec les fournisseurs.

« S’ils proposent des conditions que nous considérons comme risquées ou douteuses, nous exigeons un examen par la direction », dit-elle. « Et nous avons non seulement notre équipe de contrats en place pour la signature originale, mais également pour examiner tous les avenants demandés, afin de nous assurer que nous nous protégeons contre tout type de risque qui peut être inséré. »

Ce n’est pas seulement une préoccupation théorique. Plus tôt cette année, le fournisseur de visioconférence Zoom a ajouté des fonctionnalités d’IA générative, notamment des résumés de réunions automatisés. En mars, elle s’est donnée le droit d’utiliser les données clients pour entraîner ses modèles. Les entreprises se sont insurgées lorsque les gens ont découvert les petits caractères cet été et Zoom a rapidement inversé son cap.

Formation sur modèle

Les fournisseurs entraînant leurs modèles sur les données clients ne constituent pas le seul risque lié à la formation de l’IA générative. Plusieurs fournisseurs d’IA, dont OpenAI, sont actuellement poursuivis en justice par des artistes, des auteurs et d’autres titulaires de droits d’auteur. En fonction de l’évolution de ces poursuites, les vendeurs pourraient être amenés à modifier leur modèle économique ou à modifier leur structure de prix afin de payer les titulaires de droits d’auteur – ou éventuellement à fermer complètement boutique.

Outre les poursuites judiciaires, il existe également un potentiel de mesures réglementaires susceptibles de rendre certains types de données de formation interdits. Ces risques pourraient potentiellement s’étendre aux entreprises utilisant ces produits et services.

Les entreprises devraient également interroger les fournisseurs sur leur processus de formation modèle, explique Chandrasekara. « Dans quelle mesure sont-ils transparents dans leur processus de formation de modèles ? »

En particulier, comment s’assurent-ils qu’ils ne portent pas atteinte à des données privées, demande-t-il, et existe-t-il des poursuites judiciaires contre l’entreprise ?

Il y a une autre question que les entreprises peuvent se poser, ajoute-t-il : « Quel type de protection juridique et d’indemnisation légale m’offrent-elles en tant que client ? »

Plusieurs fournisseurs majeurs ont déjà annoncé qu’ils indemniseraient leurs entreprises clientes contre les risques potentiels liés aux droits d’auteur associés à l’utilisation de leurs produits. Microsoft, par exemple, a annoncé sa politique d’indemnisation légale pour Copilot en septembre. Si vous êtes contesté pour des raisons de droit d’auteur, a déclaré la société, nous assumerons la responsabilité des risques potentiels encourus.

Google a annoncé une politique similaire en octobre, utilisant une formulation presque identique, et

Adobe, qui propose le modèle de génération d’images Firefly, a annoncé sa propre indemnisation légale en juin. Firefly est le modèle qui alimente la nouvelle fonctionnalité de remplissage génératif de Photoshop et d’autres produits Adobe, et est également disponible en tant que service autonome. Getty, OpenAI et Amazon ont également rapidement suivi.

Est-ce qu’ils ont des douves ?

Lorsque ChatGPT a été lancé pour la première fois, il n’avait pas la capacité de lire des documents PDF, mais la capacité d’analyser le contenu d’un PDF est un cas d’utilisation majeur de l’IA générative en entreprise. En conséquence, plusieurs start-up ont vu le jour pour combler ce manque de fonctionnalités.

En octobre, ChatGPT a ajouté une fonctionnalité de téléchargement de PDF, rendant la plupart de ces start-ups inutiles du jour au lendemain. Les entreprises qui construisaient des charges de travail PDF à l’aide de la technologie de ces start-ups risquaient désormais de cesser leurs activités avant que leurs clients puissent reconstruire les systèmes.

Il ne s’agit pas d’un nouveau type de problème, déclare Andy Thurai, vice-président et analyste principal chez Constellation Research. Une startup peut facilement devenir obsolète dans n’importe quel domaine technologique. « La différence est que la vitesse à laquelle les modèles d’IA publient des fonctionnalités est ahurissante », explique Thurai. « Avec d’autres itérations logicielles, ce n’était pas si rapide. Cela prendrait six mois à un an. Cela donnerait aux petits fournisseurs le temps d’innover davantage, ou aux clients le temps de migrer.

Il recommande aux entreprises clientes d’approcher leurs fournisseurs d’IA avec une philosophie de « kill switch », et pas seulement en raison du risque qu’ils deviennent obsolètes.

Il pourrait y avoir un problème de gestion ou d’organisation, comme ce qui s’est passé chez OpenAI, dit-il.

« Et il est possible que certains de ces fournisseurs fassent faillite en un rien de temps », ajoute-t-il. « Ils pourraient rapidement dépenser leur argent et s’effondrer. Ou bien l’un de leurs systèmes est piraté et vous ne voulez plus que vos appels y transitent.

Pour se préparer à cette éventualité, les entreprises doivent disposer d’un plan de sauvegarde qui leur permet de continuer à fonctionner sans ce fournisseur particulier.

«Vous devez disposer d’une option kill switch», dit-il.

Et un kill switch ne se résume pas à la simple capacité technique de changer de fournisseur sans reconstruire l’intégralité d’une solution, explique Nick Kramer, vice-président des solutions appliquées chez SSA & Company. « Cela inclut également la capacité contractuelle de mettre fin à la relation. »

Les entreprises doivent également prêter attention à la justesse des offres de produits d’un fournisseur, déclare Sandeep Agrawal, responsable des technologies juridiques et des alliances chez PricewaterhouseCoopers.

« De nombreuses entreprises enveloppent légèrement GPT-4 ou Claude 2 et appellent cela l’IA générative », dit-il. « Mais qu’y a-t-il réellement en dessous ? Et disposent-ils des compétences adéquates en termes d’ingénierie et de gouvernance ? »

Si un fournisseur n’ajoute pas beaucoup de valeur significative, il aura du mal à rester en activité, surtout si sa fonctionnalité clé est implémentée par la plate-forme d’IA elle-même, comme ce qui s’est produit avec les PDF.

« Notre équipe juridique et notre équipe d’approvisionnement doivent comprendre et analyser les documents et contrats PDF, dont certains ont été signés il y a 20 ans », explique-t-il.

PricewaterhouseCoopers bénéficierait donc d’un fournisseur offrant la possibilité de lire des fichiers PDF, mais il s’agit désormais d’une fonctionnalité standard et ne nécessite pas de fournisseur distinct. A moins que le vendeur ait fait quelque chose de spécial. « Par exemple, disons qu’ils ont téléchargé des millions de contrats et comprennent le langage spécifique des contrats, et qu’ils ont consacré du temps et des efforts à former et à affiner le modèle afin d’obtenir de meilleures réponses à des questions spécifiques », dit-il.

Un modèle de base générique donnerait des réponses génériques aux PDF, ajoute-t-il. Cela peut fonctionner pour un utilisateur professionnel général, mais pas pour quelqu’un dans un domaine très spécifique et technique. Effectuer cette mise au point en interne prendrait beaucoup de temps, ajoute-t-il, car la rapidité de mise sur le marché est très importante.

PricewaterhouseCoopers emploie 4 000 avocats, dit-il, et possède de nombreuses données exclusives liées aux documents juridiques.

« Si vous disposez de données exclusives, vous pouvez les utiliser pour créer des modèles de domaine spécialisés pour les contrats, la recherche juridique, les litiges et les réclamations », explique-t-il. « Mais si vous essayez de construire tout cela par vous-même, vous ne réussirez pas en termes de rapidité de mise sur le marché. Et c’est l’une des principales raisons pour lesquelles nous choisissons des entreprises qui l’ont déjà fait.

Les fournisseurs spécialisés, par exemple, dans les PDF juridiques, les PDF financiers ou ceux liés à l’industrie pharmaceutique seraient toujours en mesure d’apporter de la valeur.

« Les fournisseurs doivent comprendre l’environnement de leur secteur spécifique », dit-il. « Pouvez-vous créer des attributs supplémentaires, de meilleures interfaces utilisateur et un flux de travail plus convivial ? »

Indépendance du modèle

En plus de rechercher des fournisseurs qui apportent une valeur ajoutée significative en plus du modèle de base qu’ils utilisent, PricewaterhouseCoopers choisit également des fournisseurs flexibles quant au modèle qu’ils utilisent.

«Il y a douze mois, chaque fournisseur se concentrait sur ce que ChatGPT faisait et construisait», explique Agrawal. « Désormais, de plus en plus de fournisseurs établis sont multimodèles en back-end. Ils essaient différents modèles de fondation pour différentes choses.

Quelque chose pourrait arriver à un modèle de base, ou un meilleur modèle pourrait apparaître pour un cas d’utilisation particulier.

« Si vous n’êtes pas suffisamment flexible et agile, vos clients s’éloigneront », dit-il.

Il existe désormais plus de 200 modèles de base, explique Lian Jye Su, analyste en chef de l’intelligence appliquée au sein du cabinet de conseil technologique Omdia.

« Le fournisseur doit avoir une compréhension approfondie des capacités et des technologies du modèle de fondation approprié », explique-t-il. « Et les modèles de fondation sont sujets aux hallucinations, ils doivent donc être fondés et liés à des bases de données vectorielles externes. »

Il existe désormais plus de 20 bases de données vectorielles hébergées différentes, dit-il, chacune ayant ses propres atouts. Et les fournisseurs ne sont pas les seuls à devoir faire preuve de flexibilité quant au modèle de base qu’ils utilisent. Les entreprises qui peaufinent ou forment leurs propres systèmes d’IA générative devraient également faire tout ce qu’elles peuvent pour être indépendantes des modèles, déclare Chandrasekaran de Gartner.

« Le modèle qu’ils utilisent aujourd’hui ne sera pas celui qu’ils utiliseront dans 12 mois », dit-il. « Ils doivent avoir la possibilité d’échanger ces modèles. »

Pour les entreprises qui consomment directement des modèles de base, elles peuvent créer leurs systèmes de manière à ce que la couche API soit isolée du reste de l’application. Ensuite, ils peuvent appeler l’API vers le meilleur modèle pour la tâche, ou échanger complètement les modèles lorsque de meilleurs ou moins chers arrivent.

Une autre approche envisagée par certaines entreprises consiste à créer des couches d’orchestration de l’IA pouvant s’étendre sur plusieurs systèmes et s’intégrer à différents fournisseurs de cloud, différentes sources de données, différents modèles de base et même différentes plates-formes logicielles d’entreprise.

« Lorsque vous examinez le flux commercial, vous devez l’examiner de bout en bout », explique Ram Palaniappan, CTO chez TEKsystems, un intégrateur de systèmes. « Cela peut commencer avec Salesforce et finir dans Oracle, mais cela doit commencer par l’expérience utilisateur, et le cas d’utilisation de bout en bout déterminera la façon dont vous relierez ces éléments ensemble. »

Il existe plusieurs fournisseurs proposant ces super-applications d’IA, dit-il, et les hyperscalers déploient également leurs propres options.

LangChain est l’option open source la plus connue dans cet espace. Nvidia a une solution, et Meta a LlamaIndex, qui gagne également du terrain auprès des entreprises, explique Palaniappan.

« Certains fournisseurs de plateformes, comme Google, construisent leur propre couche d’application », explique-t-il. « Ils autorisent plusieurs modèles de fondation et s’intègrent également à LangChain. » Microsoft et AWS disposent également de leurs propres créateurs d’applications, ajoute-t-il.

C’est une bonne option pour les entreprises qui s’engagent sur une plate-forme cloud unique. « Si vous souhaitez intégrer la couche application, une super application tierce sera un bon choix », dit-il. « Quelque chose comme LangChain, qui est portable sur les trois plates-formes cloud, mais si la majorité de vos besoins peuvent être satisfaits par un seul hyperscaler, alors vous n’en avez pas besoin. »




Source link