Fermer

avril 29, 2024

OpenAI pour former des LLM sur le contenu du Financial Times

OpenAI pour former des LLM sur le contenu du Financial Times



Le Financial Times (divulgation complète – les propriétaires de The Next Web) ont signé un accord avec OpenAI. La firme américaine va utiliser les contenus de l’éditeur britannique pour entraîner ses modèles d’IA générative.

Cet accord est le dernier d’une série de nouveaux partenariats entre OpenAI et des éditeurs d’information mondiaux comme Axel Springer, Associated Press et Le Monde. La société n’a divulgué les conditions financières d’aucun des contrats.

Rien qu’en 2023, des centaines de pages de litiges et d’innombrables articles ont accusé des entreprises technologiques de voler le travail d’artistes et d’éditeurs pour former leurs IA des modèles.

OpenAI a été critiqué pour avoir entraîné ses modèles GPT sur contenu récupéré du Web sans consentement. L’année dernière, le New York Times a même a poursuivi OpenAI et Microsoft pour violation du droit d’auteur.

Les récents rapprochements d’OpenAI avec des éditeurs lui permettront de continuer à entraîner ses algorithmes sur les contenus web. Mais cette fois, il aura la permission.

Partenariat stratégique

Le FT a qualifié l’accord avec OpenAI de « partenariat stratégique ».

Les plus de 100 millions d’utilisateurs de ChatGPT auront un accès direct aux résumés, citations et liens vers les articles de l’éditeur. Ce contenu est généralement caché derrière un paywall. OpenAI attribuera toutes les informations du FT à la publication.

En échange, OpenAI aidera l’agence de presse à développer de nouveaux outils d’IA. Le FT utilise déjà des produits OpenAI, dont ChatGPT Enterprise, pouvons-nous le confirmer.

Le PDG du groupe FT, John Ridding, a déclaré que l’éditeur était toujours attaché au « journalisme humain ».

« Il s’agit d’un accord important à plusieurs égards », a déclaré Ridding. « Cela reconnaît la valeur de notre journalisme primé et nous donnera un premier aperçu de la manière dont le contenu apparaît grâce à l’IA. »

« Outre les avantages pour le FT, il y a des implications plus larges pour l’industrie. Il est bien sûr vrai que les plateformes d’IA paient les éditeurs pour l’utilisation de leur matériel », a poursuivi Ridding. « OpenAI comprend l’importance de la transparence, de l’attribution et de la rémunération – toutes essentielles pour nous. En même temps, il est clairement dans l’intérêt des utilisateurs que ces produits contiennent des sources fiables.»

Usage loyal ou déloyal ?

Cependant, ce n’est pas parce qu’OpenAI se rapproche des éditeurs qu’il ne récupère plus d’informations sur le Web sans autorisation.

Plus tôt ce mois-ci, le New York Times signalé qu’OpenAI utilisait des scripts Youtube pour entraîner ses modèles. Selon la publication, cela contrevient aux lois sur les droits d’auteur, puisque les créateurs YouTube qui téléchargent des vidéos sur la plateforme conservent toujours les droits d’auteur sur le contenu qu’ils créent.

OpenAI insiste cependant sur le fait que son utilisation de matériel en ligne constitue une « utilisation équitable ». L’entreprise, ainsi que de nombreuses autres entreprises technologiques, affirment que leurs grands modèles linguistiques (LLM) transforment les informations recueillies en ligne en quelque chose d’entièrement nouveau.

Pourtant, comme nous l’avons précédemment rapporté en profondeurdes études ont montré que les LLM régurgitent systématiquement de grandes parties de leur texte de formation original textuellement.

Les accords avec les éditeurs pourraient marquer une avancée potentielle dans les conflits liés aux droits d’auteur sur l’IA. Cependant, ils resteront probablement davantage l’exception que la règle.




Source link