Une startup belge va créer un LLM capable de détecter les discours de haine dans toutes les langues de l’UE

La startup belge Textgrain construit la première IA modèle qui sera capable de détecter les discours de haine en ligne dans les 24 langues officielles de l’UE.
Fondée en 2016, Textgrain est une spin-off de l’Université d’Anvers.
La société développe des outils de gestion et d’analyse de données basés sur l’IA pour les entreprises, avec des services allant de l’analyse de texte à la mesure du sentiment en ligne sur les plateformes de médias sociaux et les sites Web. Il se concentre également sur l’analyse des discours de haine.
En juin, Textgrain figurait parmi les quatre gagnants du Large AI Grand Challenge de l’UE, appelant à des innovations en matière d’intelligence artificielle générative et de grands modèles linguistiques (LLM). L’entreprise a gagné 250 000 € et deux millions d’heures de développement sur les supercalculateurs européens (LUMI et LEONARDO), ce qui lui a permis d’accéder à une formation plus rapide sur les modèles d’IA.
Au cours des 12 prochains mois, Textgrain utilisera les ressources pour créer son propre LLM multilingue. Celui-ci se spécialisera dans la détection des discours de haine. Cependant, s’il sera capable de reconnaître un langage toxique, il ne pourra pas en générer.
Avec les discours de haine en ligne en hausse dans l’ensemble de l’UE et le reste du monde, Textgrain rejoint scientifique récente efforts pour lutter contre le phénomène avec la technologie LLM.
« Les grands modèles de langage, notamment commerciaux, refusent de traiter un langage toxique. Cela rend presque impossible leur utilisation pour traiter les discours de haine », a déclaré Guy De Pauw, PDG de Textgrain.
« Nous construisons actuellement un modèle de langage à partir de zéro, capable de traiter ce type de contenu, mais sans le générer.»
De Pauw estime que Textgrain ne risque pas de se perdre dans un « marché saturé » de fournisseurs d’IA, car la startup construit son propre LLM, tout comme des acteurs majeurs tels que OpenAI et Meta.
Un autre facteur de différenciation, dit-il, est l’approche académique de la startup et sa collaboration avec les décideurs politiques et les organisations sociales.
Le timing pourrait également jouer à l’avantage de Textgrain.
Avec l’UE Loi sur les services numériques (DSA), entrée en vigueur en février, toutes les plateformes en ligne doivent prendre des mesures pour atténuer les contenus préjudiciables, y compris les discours de haine.
Après le lancement prévu du LLM en 2025, Textgrain prévoit de se développer à l’international et se concentrera sur le développement d’autres applications SaaS.
Source link