Seekr trouve la puissance de calcul de l’IA dont il a besoin dans le cloud d’Intel

Le cloud d’Intel permet aux développeurs d’accéder à des milliers de derniers accélérateurs d’IA Intel Gaudi et de puces de processeur Xeon, combinés pour créer un supercalculateur optimisé pour les charges de travail d’IA, selon Intel. Il repose sur des logiciels ouverts, notamment oneAPI d’Intel, pour prendre en charge l’analyse comparative des déploiements d’IA à grande échelle.
Après avoir commencé à évaluer les fournisseurs de cloud en décembre, Seekr a effectué une série de tests d’analyse comparative avant de s’engager dans Intel Developer Cloud et a constaté que cela aboutissait à une formation IA 20 % plus rapide et à une inférence IA 50 % plus rapide que les mesures que l’entreprise pouvait obtenir sur site avec les solutions actuelles. matériel de dernière génération.
« En fin de compte, pour nous, la question se résume à : « Obtenons-nous le calcul d’IA de dernière génération et l’obtenons-nous au bon prix ? » », explique Clark. « Bâtiment [AI] les modèles de fondation à l’échelle de plusieurs milliards de paramètres nécessitent une grande quantité de calcul.
La puce accélératrice Gaudi 2 AI d’Intel a déjà été a reçu des notes élevées pour les performances. La puce Gaudi 2, développée par Habana Labs rachetée par Intel, a surpassé le GPU A100 80 Go de Nvidia lors de tests effectués fin 2022 par la société d’IA Hugging Face.
Cependant, la collaboration de Seekr avec Intel ne se limite pas à la performance, explique Clark. Même si Seekr a besoin d’un matériel d’IA de pointe pour certaines charges de travail, le modèle cloud permet également à l’entreprise de limiter son utilisation à la puissance de calcul dont elle a besoin sur le moment, note-t-il.
« L’objectif ici n’est pas d’utiliser en permanence le calcul approfondi de l’IA », dit-il. « La formation d’un grand modèle de base par rapport à l’inférence sur un modèle plus petit et distillé nécessite différents types de calcul. »
Source link