Clés pour parvenir à une infrastructure adéquate pour l’IA générative

On dit que les faits sont têtus. Pour l’IA générative, le fait est qu’elle consomme de grandes quantités de cycles de calcul, de stockage de données, de bande passante réseau, d’énergie électrique et de climatisation.. Alors que les DSI répondent aux mandats des entreprises de « faire quelque chose » avec l’IA générative, nombreux sont ceux qui lancent des initiatives basées sur le cloud ou sur site. Mais si les retours promis par de nombreux projets d’IA générative sont vagues, les coûts d’infrastructure nécessaires à leur fonctionnement sont limités et, trop souvent, inacceptablement élevés.
Avec ou sans infrastructure, l’IA générative est en marche. Selon IDC, Les charges de travail d’IA générative passent de 7,8 % du marché mondial des serveurs d’IA en 2022 à 36 % en 2027.. En matière de stockage, la courbe est similaire, le stockage de l’IA passant de 5,7 % en 2022 à 30,5 % en 2027. Les recherches d’IDC concluent que Environ la moitié des dépenses mondiales consacrées à l’IA générative en 2024 seront consacrées aux infrastructures numériques. Le cabinet d’analyse et de recherche prédit que Le marché mondial des infrastructures (serveurs et stockage) pour tous les types d’IA va doubler, passant de 28,1 milliards de dollars en 2022 à 57 milliards de dollars en 2027.
Mais l’énorme quantité d’infrastructure requise pour traiter les grands modèles de langage (LLM) génératifs d’IA, ainsi que les besoins en alimentation et en refroidissement, deviennent rapidement insoutenables.
Source link