Le supercalculateur GREEN500 propulse les robots scientifiques et l’apprentissage automatique transformationnel

L’Université de Cambridge en Angleterre a été reconnue lors de l’événement ISC 2022 à Hambourg, en Allemagne, pour son supercalculateur Wilkes-3 basé sur Dell, classé 8 dans le GREEN500 et 304 dans le TOP500, et le système Cumulus, noté 94 dans le GREEN500 et 316 dans le TOP500 .
Wilkes-3 et le système Cumulus fonctionnent dans une interface cloud native à pile ouverte qui augmente la flexibilité pour permettre aux différentes parties prenantes d’avoir des expériences personnalisées dans cet environnement. Ce qui est impressionnant, c’est la façon dont le Wilkes-3 fonctionne à la fois rapidement et efficacement, réduisant la consommation d’énergie tout en prenant en charge les simulations, l’IA et l’analyse de données pour la recherche à travers l’université et le Royaume-Uni.
« Lorsque vous cherchez à réduire la consommation d’énergie dans le HPC, vous vous tournez vraiment vers l’informatique GPU », a déclaré le Dr Paul Calleja, directeur de Services informatiques de recherche à l’Université de Cambridge, dans une récente À l’intérieur du CHPinterview. «Afin de réduire cette consommation d’énergie, nous avons en fait personnalisé la plate-forme en réduisant la vitesse d’horloge de ce GPU… nous avons constaté une réduction de la vitesse d’horloge de 1355 mégahertz, qui est la valeur par défaut, à 1095 réduit le LINPACK performances de seulement 10 ou 11 %, mais vous économisez environ 35 à 40 % d’énergie.
Des recherches notables récentes de l’Université de Cambridge, rendues possibles par le HPC écoénergétique, comprennent une étude sur l’apprentissage automatique transformationnel (TML) et une autre sur une approche robotique pour reproduire les résultats de la recherche.
Enseigner aux machines pour « apprendre à apprendre »
À l’aide du HPC de l’Université de Cambridge, des chercheurs créent une nouvelle méthode d’apprentissage automatique dans laquelle l’ordinateur « apprend à apprendre », ce qui pourrait faire progresser les études sur le développement de médicaments et le traitement des maladies. Une équipe du Royaume-Uni, de Suède, d’Inde et des Pays-Bas a développé l’approche, connue sous le nom d’apprentissage automatique transformationnel (TML).
Le travail, dirigé par le professeur Ross King du département de génie chimique et de biotechnologie de l’Université de Cambridge, enseigne aux ordinateurs à apprendre davantage comme le font les humains, en s’appuyant sur ce qui a été appris dans le passé.
« C’est un peu comme apprendre à un enfant à identifier différents animaux : c’est un lapin, c’est un âne, etc. », a déclaré King. dans une interview publiée. « Si vous enseignez à un algorithme d’apprentissage automatique à quoi ressemble un lapin, il sera capable de dire si un animal est ou non un lapin. C’est ainsi que fonctionne la plupart des apprentissages automatiques : il traite les problèmes un à la fois. »
Alors que la plupart des apprentissages automatiques partent de zéro, en utilisant des exemples étiquetés pour formuler des règles générales, TML peut utiliser la similarité pour faire une identification. King et l’équipe de chercheurs ont expérimenté des milliers de problèmes issus de la science et de l’ingénierie.
« Pour assurer la généralité et la robustesse de l’évaluation, [the University of Cambridge researchers] utilisé des milliers de problèmes de ML dans trois domaines scientifiques : la conception de médicaments, la prédiction de l’expression des gènes et la sélection d’algorithmes de ML », selon un article paru dans Examen des cibles médicamenteuses. L’équipe a constaté que TML améliorait considérablement les performances prédictives de toutes les méthodes ML dans tous les domaines, et que les fonctionnalités TML surpassaient généralement les fonctionnalités intrinsèques.
L’efficacité du TML pourrait faire progresser de manière significative la découverte de médicaments. Selon la recherche, un exemple de ML serait de rechercher des molécules de médicament d’une forme particulière, mais le TML peut utiliser la connexion des médicaments à d’autres problèmes de découverte de médicaments. « J’ai été surpris de voir à quel point cela fonctionne bien, mieux que tout ce que nous connaissons pour la conception de médicaments », a déclaré King.
Un robot scientifique peut-il reproduire des résultats de recherche ?
À l’appui du HPC, les scientifiques notent que les machines sont capables d’une plus grande précision que les humains. Ainsi, une équipe dirigée par l’Université de Cambridge utilise l’analyse de texte automatisée et un « robot scientifique » nommé Eve pour résoudre un problème de la science moderne : le manque de reproductibilité des résultats de recherche.
Travaillant avec des documents de recherche sur la biologie des cellules du cancer du sein, l’étude a révélé que moins d’un tiers étaient reproductibles. Les résultats, rapportés dans le Journal de l’interface de la société royale« démontrer qu’il est possible d’utiliser la robotique et l’intelligence artificielle pour aider à résoudre la crise de reproductibilité ».
« Une bonne science repose sur la reproductibilité des résultats : sinon, les résultats n’ont pratiquement aucun sens », a déclaré King dans une récente interview. « C’est particulièrement critique en biomédecine : si je suis un patient et que je lis à propos d’un nouveau traitement potentiel prometteur, mais que les résultats ne sont pas reproductibles, comment suis-je censé savoir quoi croire ? Le résultat pourrait être que les gens perdent confiance dans la science.
King a développé le robot scientifique Eve, un système basé sur l’IA capable de mener des expériences scientifiques. L’étude a utilisé des ordinateurs pour évaluer les articles scientifiques et Eve pour reproduire les expériences. L’impact de ce travail à ce jour est de prouver l’efficacité des techniques automatisées et semi-automatisées pour résoudre la crise de reproductibilité. En fait, King voit les machines jouer un rôle clé dans « une refonte complète de la façon dont beaucoup de science est faite ».
Le HPC vert ouvre la voie
Le vert est une valeur fondamentale à l’Université de Cambridge, célébrant ses systèmes, tous basés sur des serveurs Dell PowerEdge, sur la liste GREE500. Le vert est également une valeur fondamentale chez Dell Technologies, qui reconnaît la responsabilité de protéger et d’enrichir la planète avec les clients, les fournisseurs et les communautés.
À propos du système : Le Wilkes-3 exploite les serveurs Dell PowerEdge, NVIDIA A100 80 Go, InfiniBand® HDR200 double rail, avec 26 880 cœurs, 2,29 Rmax [PFlop/s]74 Puissance (kW), et une efficacité énergétique de 30.797 [GFlops/watts].
***
Les technologies Intel® font avancer l’analytique
L’analyse des données est la clé pour débloquer le maximum de valeur que vous pouvez extraire des données de votre organisation. Pour créer une stratégie d’analyse productive et rentable qui donne des résultats, vous avez besoin d’un matériel hautes performances optimisé pour fonctionner avec le logiciel que vous utilisez.
L’analyse de données moderne couvre une gamme de technologies, des plates-formes et bases de données d’analyse dédiées à l’apprentissage en profondeur et à l’intelligence artificielle (IA). Vous débutez avec l’analytique ? Prêt à faire évoluer votre stratégie d’analyse ou à améliorer la qualité de vos données ? Il y a toujours de la place pour évoluer et Intel est prêt à vous aider. Avec un vaste écosystème de technologies d’analyse et de partenaires, Intel accélère les efforts des data scientists, des analystes et des développeurs dans tous les secteurs. En savoir plus sur Analyses avancées d’Intel.
Source link