Fermer

mai 17, 2024

10 choses à garder à l’esprit avec l’IA générative open source

10 choses à garder à l’esprit avec l’IA générative open source



Au lieu de cela, dit-il, les gens sont plus susceptibles de considérer les API et les interfaces des principaux fournisseurs, tels qu’OpenAI, comme des normes de facto naissantes. « C’est ce que je vois faire chez les gens », dit-il.

8. Manque de transparence

On pourrait penser que les modèles open source sont, par définition, plus transparents. Mais ce n’est pas toujours comme ça. Les grands projets commerciaux peuvent disposer de plus de ressources pour créer de la documentation, déclare Eric Sydell, PDG de Vero AI, un fournisseur de logiciel de BI, qui vient de publier un rapport dans lequel il note les principaux modèles d’IA de genre sur la base d’aspects tels que la visibilité, l’intégrité, la préparation législative et la transparence. Gemini, de Google, et GPT-4, d’OpenAI, ont obtenu les meilleurs scores.

« Le fait qu’ils soient open source ne signifie pas nécessairement qu’ils offrent les mêmes informations sur le contexte du modèle et la manière dont il a été développé », dit Sydell. « Les modèles économiques plus larges ont fait un meilleur travail à cet égard. »

Par exemple, les préjugés.

« Nous avons constaté que les deux meilleurs modèles fermés de notre classement Ils disposaient de beaucoup de documentation et investissaient du temps à explorer le sujet », dit-il.

9. Problèmes de lignée

Il est courant que des projets open source bifurquent, mais lorsque cela se produit avec l’IA générative, il existe des risques qui ne sont pas présents avec le logiciel traditionnel. Supposons, par exemple, qu’un modèle de base utilise un ensemble de données de formation problématique et qu’à partir de celui-ci, quelqu’un crée un nouveau modèle, qui héritera donc de ces problèmes, explique Tyler Warden, vice-président senior des produits chez Sonatype, un fournisseur de cybersécurité.

« Il y a beaucoup d’aspects de boîte noire avec des poids et des spins » États.

En fait, ces problèmes peuvent remonter à plusieurs niveaux et ne seront pas visibles dans le code du modèle final. Lorsqu’une entreprise télécharge un modèle pour son propre usage, le modèle s’éloigne davantage des sources originales.. Le modèle de base d’origine a peut-être résolu les problèmes, mais en fonction de la transparence et de la communication tout au long de la chaîne, les développeurs travaillant sur le dernier modèle peuvent même ne pas être au courant des correctifs.

10. Le nouveau shadow IT

Entreprises qui utilisent des composants open source dans le cadre de leur processus de développement logiciel logiciel Ils disposent de processus pour examiner les bibliothèques et garantir que les composants sont à jour. Ils veillent à ce que les projets soient bien soutenus, à ce que les problèmes de sécurité soient résolus et à ce que les logiciel dispose des conditions de licence appropriées.

Cependant, Dans le cas de l’IA générative, les responsables de la recherche ne savent peut-être pas quoi chercher. De plus, les projets d’IA générative s’échappent parfois des processus standards de développement logiciel. logiciel. Ils peuvent émerger d’équipes de science des données ou mouffettes. Il est possible que les développeurs téléchargent les modèles pour jouer avec eux et qu’ils finissent par se généraliser. Les utilisateurs d’entreprise peuvent également suivre eux-mêmes des didacticiels en ligne et créer leur propre IA générique, en contournant l’informatique.

La dernière évolution de l’IA générative, les agents autonomes, a le potentiel de donner un pouvoir énorme à ces systèmes, augmentant ainsi le risque potentiel de ce type de Shadow IT. vers de nouveaux sommets.

« Si vous envisagez de l’expérimenter, créez un conteneur pour le faire d’une manière sûre pour votre organisation » déclare Kelley Misata, directrice principale de l’Open Source chez Corelight. Cela devrait relever de la responsabilité de l’équipe de gestion des risques d’une entreprise, dit-il, et la personne qui s’assure que les développeurs, et l’entreprise dans son ensemble, comprennent qu’il existe un processus est le DSI.

« Ils sont les mieux placés pour établir la culture », dit-il. « Profitons de l’innovation et de toute la grandeur qu’offre l’open source, mais allons-y les yeux ouverts. »

Le meilleur des deux mondes?

Certaines entreprises recherchent faible coût, transparence, confidentialité et contrôle de l’open source, mais aimerait avoir un fournisseur qui s’occupe de la gouvernance, de la durabilité à long terme et du support. Dans le monde open source traditionnel, de nombreux fournisseurs le font, tels que Red Hat, MariaDB, Docker, Automattic et d’autres.

« Ils offrent un niveau de sécurité et de protection aux grandes entreprises », déclare Priya Iragavarapu, vice-présidente de la science des données et de l’analyse chez AArete. « C’est presque un moyen d’atténuer les risques. »

Il n’y a pas beaucoup de ces fournisseurs dans le domaine de l’IA générative, mais les choses commencent à changer, conclut-il.




Source link