Les percées de la science génomique se produisent plus rapidement que jamais grâce au HPC
Depuis la première du très populaire film de clonage de dinosaures de 1993 Parc jurassique, les sciences présentées dans le film, le génie génétique et la génomique, ont progressé à un rythme époustouflant. Lorsque le film est sorti, le Human Genome Project travaillait déjà pour la première fois sur le séquençage de l’intégralité du génome humain. Ils ont achevé le projet en 2003 après 13 ans et pour un coût de 1 milliard de dollars. Aujourd’hui, le génome humain peut être séquencé en moins d’une journée et pour un coût inférieur à 1 000 $.
Une organisation de recherche en génomique de premier plan, Le Wellcome Sanger Institute en Angleterre, a pour mission d’améliorer la santé de tous les humains en développant une compréhension globale des 23 chromosomes du corps humain. Ils s’appuient sur une technologie de pointe pour fonctionner à une vitesse et à une échelle incroyables, notamment en lisant et en analysant en moyenne 40 000 milliards de paires de bases d’ADN par jour.
Parallèlement aux progrès des techniques de séquençage de l’ADN et de la biologie computationnelle, le calcul haute performance (HPC) est au cœur des avancées de la recherche génomique. Le HPC puissant aide les chercheurs à traiter des données de séquençage à grande échelle pour résoudre des problèmes informatiques complexes et effectuer des opérations informatiques intensives sur des ressources massives.
Génomique à grande échelle
La génomique est l’étude des gènes ou du génome d’un organisme. De la guérison du cancer et de la lutte contre le COVID-19 à une meilleure compréhension de l’évolution et de la croissance cellulaire des êtres humains, des parasites et des microbes, la science de la génomique est en plein essor. Le marché mondial de la génomique devrait atteindre 94,65 milliards de dollars d’ici 2028, contre 27,81 milliards de dollars en 2021, selon Perspectives d’affaires Fortune. Permettre cette croissance est un environnement HPC qui contribue quotidiennement à une meilleure compréhension de notre biologie, aidant à accélérer la production de vaccins et d’autres approches de la santé dans le monde entier.
À l’aide de ressources HPC et de techniques mathématiques connues sous le nom de bioinformatique, les chercheurs en génomique analysent d’énormes quantités de données de séquences d’ADN pour trouver des variations et des mutations qui affectent la santé, la maladie et la réponse aux médicaments. La capacité de rechercher parmi les quelque 3 milliards d’unités d’ADN à travers 23 000 gènes dans un génome humain, par exemple, nécessite des quantités massives de ressources de calcul, de stockage et de mise en réseau.
Après le séquençage, des milliards de points de données doivent être analysés pour rechercher des éléments tels que des mutations et des variations dans les virus. Les biologistes computationnels utilisent des algorithmes d’appariement de modèles, des modèles mathématiques, le traitement d’images et d’autres techniques pour obtenir un sens à partir de ces données génomiques.
Une centrale génomique
À l’Institut Sanger, la recherche scientifique se déroule à l’intersection de la génomique et de l’informatique HPC. Les scientifiques de l’Institut s’attaquent à certains des défis les plus difficiles de la recherche génomique pour alimenter les découvertes scientifiques et repousser les limites de notre compréhension de la biologie humaine et des agents pathogènes. Parmi de nombreux autres projets, le programme Tree of Life de l’Institut explore la diversité des organismes complexes trouvés au Royaume-Uni grâce au séquençage et aux technologies cellulaires. Les scientifiques créent également une carte de référence des différents types de cellules humaines.
La science à l’échelle de celle menée à l’Institut Sanger nécessite l’accès à des quantités massives de puissance de traitement de données. L’Informatics Support Group (ISG) de l’Institut aide à répondre à ce besoin en fournissant des environnements informatiques hautes performances aux équipes de recherche scientifique de Sanger. L’équipe ISG fournit des services d’assistance, de conception d’architecture et de développement pour l’environnement HPC traditionnel du Sanger Institute et une vaste infrastructure de calcul de cloud privé OpenStack, entre autres ressources HPC.
Répondre à une crise sanitaire mondiale
Pendant la pandémie de COVID-19, l’Institut a commencé à travailler en étroite collaboration avec des agences de santé publique au Royaume-Uni et des partenaires universitaires pour séquencer et analyser le virus SARS-COV-2 au fur et à mesure de son évolution et de sa propagation. Le travail a été utilisé pour éclairer les mesures de santé publique et pour aider à sauver des vies.
En septembre 2022, plus de 2,2 millions de génomes de coronavirus avaient été séquencés à Wellcome Sanger. Ils sont immédiatement mis à la disposition des chercheurs du monde entier pour analyse. Les mutations qui affectent la protéine de pointe du virus, qu’elle utilise pour se lier et pénétrer dans les cellules humaines, présentent un intérêt particulier et sont la cible des vaccins actuels. Les données génomiques sont utilisées par les scientifiques avec d’autres informations pour déterminer quelles mutations peuvent affecter la capacité du virus à se transmettre, à provoquer des maladies ou à échapper à la réponse immunitaire.
La meilleure compréhension de la société en matière de génomique et de l’informatique qui l’accompagne a accéléré le développement de vaccins et notre capacité à réagir aux maladies d’une manière qui n’avait jamais été possible auparavant. En cours de route, le monde est témoin de première main de l’incroyable puissance de la science génomique.
En savoir plus sur la génomique, l’informatique et le CHP dans ce papier blanc et étude de cas de l’Institut Wellcome Sanger.
***
Les technologies Intel® font avancer l’analytique
L’analyse des données est la clé pour débloquer le maximum de valeur que vous pouvez extraire des données de votre organisation. Pour créer une stratégie d’analyse productive et rentable qui donne des résultats, vous avez besoin d’un matériel hautes performances optimisé pour fonctionner avec le logiciel que vous utilisez.
L’analyse de données moderne couvre une gamme de technologies, des plates-formes et bases de données d’analyse dédiées à l’apprentissage en profondeur et à l’intelligence artificielle (IA). Vous débutez avec l’analytique ? Prêt à faire évoluer votre stratégie d’analyse ou à améliorer la qualité de vos données ? Il y a toujours de la place pour évoluer et Intel est prêt à vous aider. Avec un vaste écosystème de technologies d’analyse et de partenaires, Intel accélère les efforts des data scientists, des analystes et des développeurs dans tous les secteurs. En savoir plus sur Analyses avancées d’Intel.
Source link