Fermer

juin 3, 2024

Mettre en place une infrastructure adaptée à l’IA générative

Mettre en place une infrastructure adaptée à l’IA générative



Les faits, a-t-on dit, sont des choses têtues. Pour l’IA générative, le fait est qu’elle consomme de très grandes quantités de cycles de calcul, de stockage de données, de bande passante réseau, d’énergie électrique et de climatisation. Alors que les DSI répondent aux mandats des entreprises de « simplement faire quelque chose » avec genAI, nombreux sont ceux qui lancent des initiatives basées sur le cloud ou sur site. Mais même si le retour sur investissement promis par de nombreux projets genAI est nébuleux, les coûts de l’infrastructure nécessaire à leur fonctionnement sont limités et, trop souvent, inacceptablement élevés.

Qu’elle soit gourmande en infrastructures ou non, l’IA générative est en marche. Selon IDC, les charges de travail genAI augmentent de 7,8 % du marché global des serveurs IA en 2022 à 36 % en 2027. En stockage, la courbe est similaire, avec une croissance de 5,7 % du stockage IA en 2022 à 30,5 % en 2027. IDC des recherches révèlent qu’environ la moitié des dépenses mondiales en matière de genAI en 2024 seront consacrées à l’infrastructure numérique. IDC prévoit que le marché mondial des infrastructures (serveurs et stockage) pour tous les types d’IA doublera, passant de 28,1 milliards de dollars en 2022 à 57 milliards de dollars en 2027.

Mais la quantité d’infrastructures nécessaires pour traiter les grands modèles de langage (LLM) de genAI, ainsi que les besoins en énergie et en refroidissement, deviennent rapidement insoutenables.




Source link