Utiliser des données génétiques pour reconstituer l’histoire de l’humanité

Ce qui est proposé ci-dessous n’est pas issu d’un savoir universitaire (tout ceci était loin au temps de mes études) mais correspond au fruit de mes recherches (ce que j’en ai compris) passé ensuite à travers le prisme d’une transposition en activités réalisables avec le temps et les outils de la classe. J’espère n’avoir pas simplifié et tordu à l’excès la réalité de l’état des connaissances. N’hésitez pas à faire part de vos commentaires (Vous pouvez envoyer un message en cliquant sur le nom de l’auteur à droite)

première lycée Evolution Homininés Hominidés

mardi 14 janvier 2020 , par Bruno Boucher

LIAISON AVEC LE PROGRAMME
Niveau concerné Spécialité de Première
Partie du programme : La Terre, la vie et l’organisation du vivant - L’histoire humaine lue dans son génome
PLACE DANS LA PROGRESSION
Les activités proposées interviennent après que la partie Mutations de l’ADN et variabilité génétique ait été traitée. L’origine des changements de séquence de l’ADN est donc connue.
Les comparaisons de séquence dans Anagène ont été utilisées pendant ces parties précédentes
NOTIONS,COMPÉTENCES/CAPACITÉS
Notions La diversité allélique entre les génomes humains individuels permet de les identifier et, par comparaison, de reconstituer leurs relations de parentés.
Grâce aux techniques modernes, on peut connaître les génomes d’êtres humains disparus à partir de restes fossiles. En les comparant aux génomes actuels, on peut ainsi reconstituer les principales étapes de l’histoire humaine récente.
Certaines variations génétiques résultent d’une sélection actuelle (tolérance au lactose, résistance à la haute altitude) ou passée (résistance à la peste).
Compétences/Capacités Explorer quelques stratégies et outils informatiques de comparaisons de séquences entre génomes individuels.
Rechercher et exploiter des documents sur les génomes de néandertaliens et/ou de denisoviens.
Rechercher et exploiter des documents montrant l’existence d’allèles néandertaliens dans les génomes humains actuels
ACTIVITE
Activité 1 : qui sont les Denisoviens ? Activité 2 : Retrouver ses origines grâce à l’ADN ?
Activité 3 : Une histoire des populations d’après l’étude des haplogroupes
Activité 4 : L’origine de l’adaptation à l’altitude des Tibétains sur la plateforme ACCES Un autre exemple : La persistance à la lactase sur la plateforme ACCES
L’activité 4 n’est pas une proposition originale. On a cherché ici à l’articuler dans une démarche d’ensemble. L’activité 2, si elle peut sembler hors programme, permet à la fois d’introduire les SNP qui seront nécessaires pour l’activité 4 et d’aborder un phénomène de mode actuel qui pose question.
Ce ne sont que des propositions d’activité dans une proposition de séquence. On pourra choisir de réaliser tout ou partie de ce qui est proposé, ou articuler autrement ces activités ou les articuler avec d’autres, sur d’autres exemples.
Durée : 4h Coût : 0 euros Sécurité : RAS
Matériel et ressources : ordinateurs, accès à internet, logiciel Anagène ou autre logiciel permettant la comparaison de séquences, logiciel Phylogène.

Pour ces propositions, je me suis efforcé d’utiliser ces outils qui nous sont familiers. Il faut néanmoins avoir conscience qu’ils ne sont pas bien adaptés à cette nouvelle partie de programme.
Les séquences à utiliser sont trop lourdes pour ces logiciels : c’est pourquoi les activités proposées restent beaucoup sur l’ADN mitochondrial qui est petit comparativement aux chromosomes nucléaires qu’Anagène ne peut traiter. (Nous sommes dans la même situation que les chercheurs au début de ces études de paléogénomique). Même pour l’ADN mitochondrial, on verra que les temps de calcul sont assez longs. Pour Phylogène, lors de la préparation du fichier de séquence, un message indiquait que l’alignement des séquences n’était que partiel.
Mais l’inadaptation des logiciels est surtout liée au fait que l’analyse des parentés et origines se fonde plutôt sur l’étude de SNP spécifiques, des variations ponctuelles, et non sur une comparaison globale des séquences avec des % de ressemblance.

Activité 1 : Qui sont les Dénisoviens ?

Document d’appel : la découverte de fossiles dans la grotte de Denisova
La grotte de Denisova se trouve dans le massif de l’Altaï en Russie, à proximité des frontières avec la Chine et la Mongolie. Elle est étudiée depuis les années 1970 et a livré de nombreux artefacts attestant de son occupation depuis 280 000 ans.

En 2008 une phalange a été découverte dans des sédiments datés de 50 000 à 30 000 ans.
À cette époque, on connaît au moins deux espèces appartenant au genre Homo  : Homo sapiens (comme l’homme de Cro Magnon, qui est en fait notre espèce) et Homo neanderthalensis.

La phalange trouvée à Denisova. Thilo Parg/Wikimedia, CC BY-SA

PROBLEME A RESOUDRE
À quelle espèce appartient la phalange trouvée dans la grotte de Denisova ?

Trois hypothèses au moins peuvent être formulées en réponse à cette question, en fonction du document d’appel : Homo sapiens, Homo neanderthalensis et une nouvelle espèce, cette dernière étant la plus inattendue.

Ressource complémentaire :

Les chercheurs ont pu extraire et séquencer l’ADN mitochondrial de la phalange, comme avait pu en 1997 être séquencé l’ADN mitochondrial de fossiles de l’Homme de Néanderthal et montrer ainsi qu’il s’agissait bien d’une espèce différente de la nôtre, car la séquence obtenue était significativement différente de celle d’un Homo sapiens.

  • Une vidéo : Paléogénomique, qui montre comment l’ADN est obtenu, ici sur des fossiles non humains. La vidéo est longue (17 minutes 40 secondes) mais les étapes et les précautions sont montrées, y compris la PCR.
    La vidéo date par contre de 2010, donc il est probable que les techniques aient évolué.
Ressource : on donne la séquence de l’ADN mitochondrial extrait de la phalange à ouvrir dans Anagène.
ADN mitochondrial de la phalange de Denisova



Source : https://www.ncbi.nlm.nih.gov/nuccore/FN673705.1?report=fasta
Informations sur la séquence : https://www.ncbi.nlm.nih.gov/pubmed?LinkName=nuccore_pubmed&from_uid=291622149

Déroulement de l’activité
  • Consigne : proposez une méthode permettant de déterminer à quelle espèce appartenait l’individu dont on a retrouvé la phalange. Vous préciserez les données complémentaires dont vous avez besoin ainsi que le résultat que vous attendez.

Réponse attendue : on va comparer la séquence de l’ADN mitochondrial extrait de la phalange avec les séquences de l’ADN mitochondrial d’Homo sapiens et d’Homo neanderthalensis, par exemple avec le logiciel Anagène. Nous aurons donc besoin de ces deux autres séquences.
L’espèce à laquelle appartient cette phalange sera celle avec laquelle il y a le plus de ressemblances entre les séquences.

  • Consigne : Utilisez les fonctions du logiciel Anagène pour traiter les séquences à votre disposition afin de déterminer l’espèce à laquelle appartient l’individu dont on a retrouvé la phalange.
Ressources supplémentaires : séquences de l’ADN mitochondrial d’Homo sapiens et d’Homo neanderthalensis fossiles
ADNmt_fossiles
Sources : H. neanderthalensis- H. sapiens
COMMUNICATION DES RÉSULTATS, OBSERVATIONS, RECHERCHES

Comparaisons avec alignement de séquence d’ADN mitochondrial de différents homininés, dans Anagène 2

Comparaison % d’identité
Denisova/Sapiens
Denisova/Neanderthal

Pour aller plus loin, on peut se poser la question du % de différence nécessaire et suffisant pour déclarer qu’il s’agit d’espèces différentes.

Pour s’en faire une idée, on peut imaginer de comparer

  • des séquences appartenant à des espèces différentes : on pourra ici utiliser neanderthal et sapiens
  • des séquences appartenant à des individus appartenant à la même espèce.
    D’autres ADN néanderthaliens ont été séquences, par exemple :
    https://www.ncbi.nlm.nih.gov/nuccore/MG025536.1
    neanderthalensis_les_cottes_z4_1514 mt

Comparaisons avec alignement de séquence d’ADN mitochondrial de différents homininés, dans Anagène 2

Comparaison % d’identité
Néanderthal/Sapiens
Néanderthal/Neanderthal
sapiens/sapiens
LES RÉPONSES ATTENDUES

On trouve que l’ADN mitochondrial ne ressemble finalement ni à celui d’un Homo neanderthalensis, ni à celui d’un Homo sapiens. Les différences sont très supérieures à ce qu’on trouve entre individus d’une même espèce.
On peut en conclure qu’il s’agit donc d’une autre espèce.

EVALUATIONS POSSIBLES
  • Mise en situation
La grotte de Denisova a livré d’autres restes humains, comme une molaire. De l’ADN mitochondrial a pu être extrait de cette molaire.
On se demande à quelle espèce elle appartient.

Ressource complémentaire :
ADN mitochondrial de la molaire de Denisova
  • Consigne  : à l’aide des ressources à votre disposition, indiquez à quelle espèce se rattache l’individu qui possédait cette molaire.
  • Résultat

Il y a 100% d’identité entre l’ADN mitochondrial de la molaire et celui de la phalange.
On déduit que cette molaire appartient bien à un Denisovien.

NB : dans tout ce qui précède, on travail sur l’ADN mitochondrial et non sur l’ADN nucléaire, ce qui a une influence sur les conclusions.
Ici par exemple les 100% d’identité de l’ADN mitochondrial ne signifient pas qu’il s’agit du même individu.

Pour aller plus loin : construire une phylogénie avec Phylogène
Une fois établie l’existence des Denisoviens se pose la question de leur place dans la phylogénie du genre Homo. La collection Lignee-humaine dans Phylogène permet de construire un arbre intégrant denisova aux côté de sapiens et néanderthal.
Compléments pour l’enseignant :


Activité 2 : Mon histoire inscrite dans mon génome ?

Document d’appel

La vidéo peut être arrêtée à 3 minutes.

( Pour mémoire, Squeezie est le vidéaste francophone le plus suivi , avec plus de 14 millions d’abonnés à sa chaîne Youtube. Il y a une forte probabilité qu’il soit connu voire suivi par bon nombre d’élèves)

PROBLEME A RESOUDRE
Comment peut-on déterminer nos origines à partir de notre ADN ?
Déroulement de l’activité
1ère partie : l’ADN mitochondrial
  • Consigne : Barnabé a commandé sur internet un kit de test ADN pour déterminer ses origines. Les résultats reçus indiquent qu’il a une origine européenne avec une forte probabilité, d’après son ADN mitochondrial.
    A partir des documents ci-dessous, justifiez cette conclusion.

NB : le travail proposé ici n’est qu’une version très restreinte de l’analyse réelle qui est faite à partir des tests ADN, qui porte sur un volume de données beaucoup important. C’est pourquoi des résultats réels proposeraient une appartenance à une population plus précise que ce que nous ferons.

  • Documents :
Document A  : On peut trouver de nombreuses différences si on compare l’ADN de deux individus. Les variations les plus abondantes ne portent que sur un seul nucléotide. On les appelle des SNP (single-nucleotide polymorphism). Elles sont le résultat de mutations ponctuelles passées. Elles peuvent être présentes dans les gènes mais aussi en dehors. Elles peuvent survenir dans l’ADN nucléaire ou l’ADN mitochondrial.
Elles sont assez fréquentes (tous les 100 à 300 nucléotides environ) et sont relativement stables dans le temps, sur plusieurs générations. C’est pourquoi on peut les utiliser dans la phylogénie humaine.
Pour ce type d’étude, l’ADN mitochondrial ou celui du chromosome Y présentent l’avantage d’être moins soumis aux recombinaisons (échanges entre chromosomes).
Ils racontent toutefois deux histoires complémentaires car l’ADN mitochondrial est transmis par la mère (on suit une lignée maternelle) alors que le chromosome Y n’est transmis que par le père (on suit une lignée paternelle).

Grâce aux progrès de l’analyse ADN, les SNP ont pu être identifiés et cartographiés, ainsi que leurs variations dans les populations. Pour cela on ne séquence pas nécessairement l’intégralité du génome mais on peut utiliser des puces à ADN, sur lesquelles chaque puits comporte un fragment d’ADN simple brin de séquence connue. L’échantillon d’ADN à analyser est coupé en fragments simple brin sur lesquels est accrochée une substance fluorescente. Au passage de l’échantillon sur la puce, les séquences complémentaires vont se lier. Les autres fragments sont lavés et éliminés. Les puits présentant une fluorescence vont indiquer les séquences présentes dans l’échantillon.

Voir les premières 25 secondes de cette vidéo :



La cartographie des SNP, précise car ils sont nombreux, permet de les utiliser comme marqueur génétique pour identifier le génotype des individus.
On définit un haplotype comme un ensemble d’allèles tendant à être transmis ensemble.
Un haplogroupe est un groupe d’individus qui ont la même combinaison d’allèles de SNP sur leur ADN

Document B : ADN mitochondrial de Barnabé, à ouvrir dans Anagène



Source : Homo sapiens haplogroup H mitochondrion, complete genome

Document C : SNP spécifiques pour quelques haplogroupes sur l’ADN mitochondrial
Haplogroupe SNP Spécifiques
M G10400A
A T1736C
H C2706T
L3 C769T
NB : convention d’écriture
C769T = C est le nucléotide des individu de l’haplogroupe L3 - 769 est la localisation du SNP - T est le nucléotide des individus n’appartenant pas à l’haplogroupe
Sources :
 http://ase.tufts.edu/chemistry/hhmi/documents/Detailed_Haplogroup_Activity.pdf
 https://www.snpedia.com/index.php/Haplogroup_H_(mtDNA)
Pour avoir une correspondance avec la séquence dans Anagène, qui donne le brin non transcrit, j’ai mis le nucléotide complémentaire par rapport aux documents sources.
Document D : carte des haplogroupes mitochondriaux (partie A du document ci-dessous)
MtDNA haplogroup distribution among 2,054 individuals across 26 populations from the 1000 Genomes Project.png
By Lavanya Rishishwar and I. King Jordan - Rishishwar L, Jordan IK. Implications of human evolution and admixture for mitochondrial replacement therapy. BMC Genomics. 2017 ;18:140. doi:10.1186/s12864-017-3539-3. https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-017-3539-3, CC BY 4.0, Link
LES RÉPONSES ATTENDUES

La recherche des SNP caractéristiques dans la séquence de Barnabé montre qu’il possède l’allèle caractéristique de l’haplogroupe H, et pas pour les autres haplogroupes.

On en déduit qu’il appartient à l’haplogroupe H, qui d’après la carte est présent dans une large proportion de la population européenne, d’où une forte probabilité d’une origine européenne.

2ème partie : l’ADN du chromosome Y
  • Consigne : Barnabé a aussi dans ses résultats les SNP pour son chromosome Y.
    A partir des document et ressource ci-dessous, indiquez si les données du chromosome Y indiquent aussi une origine européenne.
  • Documents
Document A : Extrait des résultats de Barnabé pour le chromosome Y
Chromosome Position Variant Allèle de Barnabé
Y 15174113 rs17307398 T
Y 20588697 rs1558843 A
Document B : Base de données E !nsembl
et sa fiche technique pour l’interroger.
FT Ensembl
LES RÉPONSES ATTENDUES

La consultation de la base de données va montrer que les allèles possédés par Barnabé pour les deux variants proposés sont majoritaires dans la population européenne.

rs1558843 rs17307398

On en déduit qu’il y a une forte probabilité que Barnabé ait une origine européenne.

Discussion et prolongement

Le recours aux tests ADN pour déterminer ses origines s’est démocratisé ces dernières années aux États-Unis, succès relayé et amplifié par des célébrités.
Ce succès s’est propagé dans d’autres pays. En France, on trouve facilement sur Internet des vidéos de vidéastes plus ou moins connus qui en ont aussi utilisé.

Ces tests ADN posent un certain nombre de questions, qu’il pourrait être intéressant d’aborder avec les élèves :

  • ces tests sont illégaux en France (3 750 euros d’amende), bien qu’il ne soit guère compliqué d’en commander sur Internet. La loi prévoit que ce type de test ne puisse être réalisé qu’à la demande de la police, d’un juge ou d’un médecin.
  • les compagnies qui mettent en vente ces kits lorgnent sur le marché de la santé, en faisant le lien entre allèles et risque de maladie. Se pose alors la question d’un individu qui reçoit cette information en dehors de tout cadre médical, sans accompagnement pour la comprendre et en cerner les limites (par exemple influence de l’environnement) dans les maladies multifactorielles.
    A voir : exemple de rapport sur le site de 23andme - Rapport avec un variant lié à la maladie de Parkinson
  • ces mêmes compagnies, au fur et à mesure qu’elles ont des clients, remplissent leurs bases de données et pourraient les monnayer, par exemple à des organismes de recherche médicale publics ou privés.
  • la fiabilité de l’interprétation données sur les origines dépend du nombre de SNP analysés et de la base de données utilisé. Ainsi deux compagnies ou la même compagnie à deux temps différents ne vont pas fournir le même résultat.
A lire pour en savoir plus

Pour aller plus loin et faire le lien avec l’activité 1 :
Avec les progrès du séquençage, les chercheurs ont pu finalement travailler sur de l’ADN nucléaire, proposant par exemple cet arbre :

Un outil en ligne permet de visualiser et de comparer des séquences anciennes et actuelles, et des SNP sont signalés. Un clic donne accès à des informations sur chaque variant, y compris des fréquences d’allèles.


Activité 3 : Une histoire des populations d’après l’étude des haplogroupes

Activité préparatoire
  • Consigne : dans Anagène, comparez la séquence de l’ADN mitochondrial des individus des haplogroupes H avec celle des haplogroupes H1a et L2a1a1 et relevez les % d’identité.
Séquence de l’ADNmt de l’haplogroupe H Séquence de l’ADNmt de l’haplogroupe H1a Séquence de l’ADNmt de l’haplogroupe L2a1a1
haplogroup_h_mitochondrion.edi


Source

haplogroup_h1a_mitochondrion.edi


Source

haplogroup_l2a1a1_mitochondrion.edi


Source

  • Questions
    1. Quelle peut être l’origine des ressemblances entre les séquences de l’ADN mitochondrial de deux individus ?
    2. D’après vos connaissances, quelle peut être l’origine des différences entre les séquences de l’ADN mitochondrial de deux individus ?
    3. Proposez une explication à la plus grande ressemblance entre les haplogroupes H et H1a
LES RÉPONSES ATTENDUES
Captures d’écran dans Anagène 2

On attend ici un rappel sur une origine commune, avec un ancêtre commun dont les ressemblances sont l’héritage, et sur les mutations (vues en Seconde comme origine de la diversité des allèles) pour expliquer les différences qui apparaissent lorsque des lignées se séparent.
Il en découle qu’une plus grande parenté se traduit par plus de ressemblance.

Application
  • Consigne : Utilisez les séquences d’ADN mitochondrial proposées pour déterminer quels sont les haplogroupes avec le plus de ressemblances, et donc les plus apparentés, dans le logiciel Phylogène.
Ressources
Les séquences pour Anagène Les séquences pour Phylogène FT phylogène
haplogroupes.edi
haplogroupes.aln
Sur le site de l’académie de Toulouse
Sources :
 haplogroupe u4d1a
 haplogroupe B4
 haplogroupe I3a
 haplogroupe L2a1a1
LES RÉPONSES ATTENDUES
Matrice
Arbre

On observe une plus grande proximité et donc parenté entre les haplogroupes H et H1a, tandis que l’haplogroupe L2a1a1 est le plus distant.

Discussion et prolongement

L’arbre obtenu ici n’apparaît pas aberrant par rapport à ceux qu’on peut trouver. Par exemple :

Source : d’après https://en.wikipedia.org/wiki/Human_mitochondrial_DNA_haplogroup

Ces relations de parenté permettent alors d’ouvrir sur une histoire des migrations des populations humaines, dont la répartition actuelle des haplogroupes est l’héritage.

Human migrations and mitochondrial haplogroups.PNG
By User:Maulucioni - Migraciones humanas en haplogrupos mitocondriales.PNG, CC BY-SA 3.0, Link

  Activité 4 : L’origine de l’adaptation à l’altitude des Thibétains (lien externe sur le site ACCES)

Documents joints

Dans la même rubrique