Site icon Blog ARC Optimizer

Ce que nous pouvons apprendre du séquençage d'un million de génomes humains avec le Big Data


La première ébauche du génome humain fut publiée il y a 20 ans dans 2001 prit près de trois ans et coûta entre 500 millions et 1 milliard de dollars . Le Human Genome Project a permis aux scientifiques de lire, presque de bout en bout, les 3 milliards de paires de bases d'ADN – ou «lettres» – qui définissent biologiquement un être humain.

Ce projet a permis un nouveau génération de chercheurs comme moi actuellement stagiaire postdoctoral au National Cancer Institute, pour identifier de nouvelles cibles pour les traitements du cancer des souris ingénieur avec un système immunitaire humain et même créer une page Web sur laquelle n'importe qui peut naviguer dans tout le génome humain avec la même facilité que vous utilisez Google Maps.

Le premier génome complet a été généré à partir d'une poignée de donneurs anonymes pour essayer de produire un génome de référence cela représentait plus d'un seul individu. Mais cela était loin d'englober la grande diversité des populations humaines dans le monde . Il n'y a pas deux personnes identiques et il n'y a pas deux génomes identiques non plus. Si les chercheurs voulaient comprendre l'humanité dans toute sa diversité, il faudrait séquencer des milliers ou des millions de génomes complets. Maintenant, un projet comme celui-là est en cours.

Crédit: Gerd Altmann de Pixabay
Il y a une énorme quantité de variation génétique entre

Comprendre la diversité génétique

La richesse de la variation génétique entre les personnes est ce qui rend chaque personne unique. Mais les changements génétiques provoquent également de nombreux troubles et rendent certains groupes de personnes plus sensibles à certaines maladies que d'autres.

À l'époque du projet sur le génome humain, les chercheurs séquençaient également les génomes complets d'organismes tels que des souris ] mouches des fruits levures et certaines plantes . L'énorme effort consenti pour générer ces premiers génomes a conduit à une révolution dans la technologie nécessaire à la lecture des génomes. Grâce à ces avancées, au lieu de prendre des années et de coûter des centaines de millions de dollars pour séquencer tout un génome humain, il faut maintenant quelques jours et ne coûte que mille dollars . Le séquençage du génome est très différent des services de génotypage comme 23 et Me ou Ancestry, qui n'examinent qu'une infime partie des emplacements dans le génome d'une personne.

Les progrès technologiques ont permis aux scientifiques de séquencer les génomes complets de milliers d'individus du monde entier. monde. Des initiatives telles que les Consortiums d'agrégation du génome s'efforcent actuellement de collecter et d'organiser ces données dispersées. Jusqu'à présent, ce groupe a pu rassembler près de 150 000 génomes qui montrent une quantité incroyable de diversité génétique humaine. Dans cet ensemble, les chercheurs ont trouvé plus de 241 millions de différences dans les génomes des gens, avec une moyenne d'une variante pour huit paires de bases .

La plupart de ces variations sont très rares et n'auront aucun effet une personne. Cependant, parmi eux, se cachent des variantes aux conséquences physiologiques et médicales importantes. Par exemple, certaines variantes du gène BRCA1 prédisposent certains groupes de femmes, comme les juifs ashkénazes, au cancer de l'ovaire et du sein . D'autres variantes de ce gène amènent certaines Nigérianes à subir une mortalité plus élevée que la normale due au cancer du sein.

La meilleure façon pour les chercheurs d'identifier ces types de variantes au niveau de la population est par l'association du génome. études qui comparent les génomes de grands groupes de personnes avec un groupe témoin. Mais les maladies sont compliquées. Le mode de vie, les symptômes et le moment d’apparition d’un individu peuvent varier considérablement et l’effet de la génétique sur de nombreuses maladies est difficile à distinguer. Le pouvoir prédictif de la recherche génomique actuelle est trop faible pour démêler nombre de ces effets car il n'y a pas assez de données génomiques .

Comprendre la génétique de maladies complexes, en particulier celles liées aux différences génétiques entre groupes ethniques, est essentiellement un problème de big data. Et les chercheurs ont besoin de plus de données.

1 000 000 de génomes

Le lien entre la génétique et la maladie est nuancé, mais plus vous pouvez étudier de génomes, plus il est facile de trouver ces liens. Image via brian0918 / Wikimedia Commons

Pour répondre au besoin de plus de données, les National Institutes of Health ont lancé un programme appelé All of Us . Le projet vise à collecter des informations génétiques, des dossiers médicaux et des habitudes de santé à partir d'enquêtes et d'appareils portables de plus d'un million de personnes aux États-Unis sur une période de 10 ans. Il a également pour objectif de recueillir davantage de données sur les groupes minoritaires sous-représentés afin de faciliter l'étude des disparités en matière de santé. Le projet All of Us s'est ouvert au public en 2018, et plus de 270 000 personnes ont fourni des échantillons depuis. Le projet continue de recruter des participants des 50 États. De nombreux laboratoires universitaires et entreprises privées participent à cet effort.

Cet effort pourrait profiter aux scientifiques d'un large éventail de domaines. Par exemple, un neuroscientifique pourrait rechercher des variations génétiques associées à la dépression tout en tenant compte des niveaux d'exercice. Un oncologue pourrait rechercher des variantes qui sont en corrélation avec un risque réduit de cancer de la peau tout en explorant l'influence de l'origine ethnique.

Un million de génomes et les informations qui l'accompagnent sur la santé et le mode de vie fourniront une extraordinaire richesse de données qui devraient permettre aux chercheurs de découvrir les effets. de la variation génétique des maladies, non seulement pour les individus, mais aussi au sein de différents groupes de personnes.

[ Comprendre chaque semaine les nouveaux développements de la science, de la santé et de la technologie. ].]

La matière noire du génome humain

Un autre avantage de ce projet est qu'il permettra aux scientifiques de découvrir des parties du génome humain qui sont actuellement très difficiles à étudier. La plupart des recherches génétiques ont porté sur les parties du génome qui codent pour les protéines. Cependant, ceux-ci ne représentent que 1,5% du génome humain .

Mes recherches portent sur l’ARN – une molécule qui transforme les messages codés dans l’ADN d’une personne en protéines. Cependant, les ARN qui proviennent des 98,5% du génome humain qui ne produisent pas de protéines ont une myriade de fonctions en eux-mêmes. Certains de ces ARN non codants sont impliqués dans des processus tels que comment le cancer se propage développement embryonnaire ou contrôlant le chromosome X chez les femmes . En particulier, j'étudie comment les variations génétiques peuvent influencer le repliement complexe qui permet aux ARN non codants de faire leur travail. Étant donné que le projet All of Us comprend toutes les parties codantes et non codantes du génome, il sera de loin le plus grand ensemble de données pertinent pour mon travail et, espérons-le, éclairera ces mystérieux ARN.

Le premier génome humain a déclenché 20 ans. d’incroyables progrès scientifiques. Je pense qu'il est presque certain qu'un énorme ensemble de données sur les variations génomiques débloquera des indices sur des maladies complexes. Grâce à des études démographiques à grande échelle et à des projets de mégadonnées comme All of Us, les chercheurs ouvrent la voie à une réponse, au cours de la prochaine décennie, à la manière dont notre génétique individuelle façonne notre santé.

Cet article par Xavier Bofill De Ros chercheur en biologie de l'ARN, National Institutes of Health est republié de The Conversation sous une licence Creative Commons. Lire l'article original .




Source link
Quitter la version mobile