Fermer

juin 24, 2024

Une longueur d’avance en matière de refroidissement avancé pour l’IA et le HPC

Une longueur d’avance en matière de refroidissement avancé pour l’IA et le HPC



L’intelligence artificielle (IA) et le calcul haute performance (HPC) sont devenus des domaines d’opportunité clés pour l’innovation et la transformation des entreprises.

Le défi pour Responsables informatiques est de permettre ces charges de travail à haute densité avec la bonne infrastructure informatique, et la communauté discute de plus en plus de technologies de refroidissement avancées telles que le refroidissement liquide.

Alors que le refroidissement liquide direct (DLC) est aujourd’hui plus que jamais déployé dans les centres de données, seriez-vous surpris d’apprendre que nous l’avons déployé dans nos centre de données designs chez Digital Realty depuis 2015 ? Saviez-vous également que le refroidissement liquide n’est pas toujours le bon choix pour chaque charge de travail IA ou HPC haute densité ?

Dans cet article, j’aborderai les bases des besoins en refroidissement des centres de données pour les charges de travail à haute densité telles que l’IA et le HPC, et comment l’héritage d’innovation de Digital Realty nous a préparés à répondre à l’accélération de la demande de techniques de refroidissement avancées de toutes sortes. y compris le refroidissement liquide.

Je partagerai également des études de cas tirées de notre parcours d’innovation qui démontrent à quel point l’innovation repose sur la bonne stratégie et les bons partenaires, plutôt que sur une approche universelle.

Besoins de refroidissement des charges de travail haute densité

La densité d’un déploiement IA ou HPC détermine ses besoins uniques en matière de refroidissement.

Les exigences en matière de densité de puissance pour l’IA et le HPC peuvent être 5 à 10 fois supérieures à celles d’autres cas d’utilisation de centres de données. Les charges de travail traditionnelles se situent généralement entre 5 et 8 kW par rack.

Il est probable que certains matériels informatiques permettent des densités de puissance supérieures à 100 kW/rack et la densité maximale dans le centre de données pourrait atteindre 150 kW/rack au cours des deux prochaines années.

Les densités de charge de travail traditionnelles peuvent être refroidies, mais d’une manière générale, la plupart Flux de travail IA et HPC nécessitent un refroidissement spécialisé tel que le refroidissement liquide direct (DLC), le refroidissement liquide par air-assistant (AALC) ou un échangeur de chaleur à porte arrière.

Toutes les charges de travail IA et HPC ne nécessitent pas de refroidissement liquide

Les exigences en matière de refroidissement liquide varient selon le fournisseur de matériel, le matériel spécifique lui-même et le type de charge de travail. Le refroidissement liquide n’est pas adapté à tous les matériels ni à tous les scénarios.

Même à l’ère de l’IA, tous les racks ne consommeront pas 100 kW et n’exigeront peut-être même pas un refroidissement avancé spécialisé.

Par exemple, les déploiements d’inférence ont tendance à être moins gourmands en énergie que les déploiements de formation et peuvent être refroidis avec des techniques traditionnelles de refroidissement par air. L’apprentissage automatique nécessite moins de ressources, tandis que l’apprentissage profond et l’IA générative nécessitent des environnements massifs en raison de leur complexité.

Il est important que les responsables informatiques comprennent que les différentes charges de travail d’IA et HPC ont des besoins de refroidissement différents et que tous les partenaires de centres de données ne disposent pas des connaissances spécialisées ou des capacités d’infrastructure nécessaires pour activer cette technologie.

Les exigences de chaque déploiement varient, il est donc important de travailler avec un partenaire qui concevra une solution personnalisée et ne dépendra pas d’une approche universelle. C’est pourquoi l’héritage de Digital Realty conception de centre de données notre expertise en matière de refroidissement avancé fait la différence pour nos clients.

Stratégies d’innovation

La plateforme mondiale de centre de données de Digital Realty, PlateformeDIGITAL®a été choisi pour héberger de nombreuses charges de travail révolutionnaires en matière d’IA et de HPC.

Nous avons appris que pour favoriser l’innovation, quelques stratégies clés nous aident non seulement à suivre le rythme de la technologie, mais aussi à garder une longueur d’avance.

Les stratégies informatiques pour prendre en charge les flux de travail IA et HPC doivent permettre :

  1. Agilité
  2. Échelle
  3. Une croissance durable

Ces études de cas tirées de notre propre parcours d’innovation au cours de la dernière décennie mettent en lumière ces stratégies en action. Ils démontrent également comment notre expertise et notre stratégie d’innovation nous aident à identifier la bonne solution à la situation plutôt que de nous fier à une approche universelle.

Études de cas d’innovation

Activer l’évolutivité : un moteur de trading de grande capacité avec refroidissement liquide

2015 a été une année de transformation pour nous chez Digital Realty ; c’était aussi ma première année dans l’entreprise. Nous nous sommes lancés dans un projet ambitieux visant à jeter les bases d’une services financiers société spécialisée dans le trading algorithmique à haute fréquence.

Une partie importante de cette entreprise a consisté en un changement stratégique du refroidissement par air traditionnel vers un refroidissement liquide avancé jusqu’au niveau des puces pour prendre en charge les clusters HPC. Cette prouesse technique a non seulement amélioré l’efficacité du système de refroidissement, mais nous a également permis de faire évoluer notre technologie pour continuer à soutenir notre client alors que son déploiement atteignait près de 6 MW.

Investir dans une technologie de refroidissement liquide de nouvelle génération était une décision dont nous savions qu’elle permettrait à notre client d’aller au-delà de ses besoins immédiats et d’établir une capacité axée sur l’évolutivité à long terme et durabilité.

Permettre une croissance durable : le calcul intensif avec une conception adaptable

Récemment, nous nous sommes associés à un client européen pour développer un environnement de supercalculateur sophistiqué comprenant jusqu’à 70 kW par rack dans un environnement mixte. Le client avait besoin de déployer rapidement tout en se conformant aux nouvelles réglementations en matière de développement durable.

Attendre 3 à 5 ans pour construire un nouveau centre de données n’était pas une option, c’est pourquoi notre capacité à moderniser les installations existantes permet aux clients d’être opérationnels plus rapidement. En prenant une installation économe en énergie que nous avons construite en 2013, nous avons pu répondre à leurs exigences exigeantes en matière de densité de puissance élevée et connectivité avec des changements minimes à nos installations. Cela a permis un déploiement 400 % plus rapide.1

Notre client prévoyait une amélioration de 30 % de l’efficacité énergétique en passant au refroidissement liquide.1 Ils ont également bénéficié du système de refroidissement de stockage d’énergie thermique aquifère (ATES) de Digital Realty et de sources d’énergie entièrement renouvelables pour atteindre les objectifs de CO2 fixés par les réglementations locales en matière de développement durable.

Notre capacité à développer des conceptions de rénovation montre notre engagement envers une conception à la fois avant-gardiste et agile qui permet une croissance durable et opportune. Nos principes de conception garantissent que notre infrastructure répondra non seulement aux besoins actuels, mais également aux exigences des décennies à venir.

Favorisez l’agilité : un déploiement d’IA générative flexible et évolutif

Aujourd’hui, nous jouons un rôle clé dans l’avancement de l’IA générative (GenAI). Nous travaillons avec un client qui intègre plus de 30 000 GPU parmi les plus avancés dans une seule plateforme massive.

Pour permettre des performances informatiques avancées, le déploiement nécessite que chaque GPU soit connecté dans un seul cluster informatique. Ils avaient besoin d’un fournisseur de plate-forme de centre de données capable de les aider à se déployer rapidement pour commencer à rentabiliser leur investissement GPU, ce qui était encore plus difficile compte tenu de leurs exigences de conception spécialisées.

Notre stratégie d’investissement vise à anticiper la demande future, ce qui nous a permis de leur proposer une installation prête à l’emploi et dotée de conceptions prêtes. Notre approche de conception agile et modulaire nous a permis de résoudre leurs défis de conception complexes tout en conservant 99 % de la conception originale, ce qui nous a permis de commencer la construction plus tôt.

Notre approche agile leur permettra de déployer en 12 mois seulement, au lieu des 36 mois dont ils auraient besoin avec une construction personnalisée.1 Les exigences de nos clients évoluent rapidement, tout comme la technologie et les solutions pour y répondre. C’est pourquoi l’agilité doit être une stratégie centrale pour permettre l’innovation.

Même s’il s’agit de la définition d’une charge de travail d’IA avancée, le refroidissement liquide direct n’était pas le meilleur choix en matière de refroidissement. Il s’agit d’un bon exemple de la raison pour laquelle une approche universelle du refroidissement des charges de travail à haute densité ne fonctionne pas.

Au-delà des infrastructures : favoriser une culture de l’innovation

Pour exécuter ces stratégies d’innovation, un autre élément clé est votre équipe de personnes. Pour tous les responsables informatiques, il est important de se rappeler que nos réalisations ne concernent pas seulement l’infrastructure : elles dépendent de la culture de l’innovation que nous avons cultivée.

Chez Digital Realty, nos équipes talentueuses apportent un héritage d’innovation et d’ingénierie pour lequel nous avons reçu de nombreux prix en tant que pionniers dans le domaine des centres de données.

Notre culture d’innovation chez Digital Realty permet de s’aligner sur nos clients, garantissant ainsi que nos partenaires sont convaincus qu’ils peuvent grandir avec Digital Realty dans le futur.

Une vision pour l’avenir

Mon rôle en tant que directeur de la technologie chez Digital Realty est de comprendre les besoins technologiques de nos clients et de garantir que Digital Realty peut répondre à ces besoins, non seulement pour aujourd’hui mais pour demain.

Alors que nous regardons vers l’avenir, nous restons déterminés non seulement à participer au paysage technologique, mais aussi à le façonner activement. Notre mission est de permettre à nos clients d’innover en favorisant l’agilité, l’évolutivité et une croissance durable.

La durabilité est particulièrement importante pour nous. Nous continuons d’élargir notre couverture de sources d’énergie renouvelables et sans carbone pour suivre le rythme de la demande des clients – nous avons plus de 1 gigawatt d’énergie solaire et éolienne sous contrat — et nous avons commencé à utiliser des solutions d’alimentation secondaire à carburant alternatif pour réduire davantage l’empreinte carbone du cycle de vie de nos centres de données.

Nous nous concentrerons sur l’application de la meilleure technologie à temps pour répondre aux besoins de nos clients, plutôt que de déployer en gros le statu quo et de forcer les clients de demain à accepter les limites d’hier. Cette approche est ce qui a permis à Digital Realty de fournir les exemples mis en évidence tout au long de cet article, ainsi que toutes sortes d’autres besoins de clients à travers le monde.

Notre adaptabilité, notre esprit d’innovation et notre riche héritage font de nous une entreprise unique et durable dans le monde de la technologie en constante évolution.

Construire un héritage d’innovation ne se fait pas du jour au lendemain, mais chez Digital Realty, nous avons appris que nous allons toujours dans la bonne direction lorsque nous sommes fidèles à nos valeurs et concentrés sur la meilleure façon de répondre aux besoins de nos clients.

Rejoignez-nous chez Digital Realty alors que nous continuons à définir l’avenir de la technologie. Restez innovant, contactez-nouset déployons l’IA et le HPC de manière à transformer votre organisation.

Apprendre encore plus à propos de l’infrastructure de centre de données prête pour l’IA :

1 Résultat prévu pour ce client par rapport à son infrastructure existante avant son déploiement et sa connexion sur PlatformDIGITAL® ou par rapport aux solutions alternatives disponibles au moment de l’achat.




Source link