Korrespondierender Autor

Julien Dutheil
Telefon:+49 4522 763-298Fax:+49 4522 763-281

Developmental Biology • Evolutionary Biology • Genetics

Research report (imported) 2016 - Max Planck Institute for Evolutionary Biology

Wie man durch Modelle die Entstehung des Erbguts und die Bildung von Arten beschreiben kann

Models of genome evolution and the origin of species

Authors

Dutheil, Julien Y.

Departments

Forschungsgruppe Molekulare System Evolution

DOI

10.17617/1.M

Ein Modell zu erstellen, in dem die Entwicklung des gesamten Genoms einer Population unter Berücksichtigung von Rekombinationen und Mutationen abgebildet wird, ist eine Herausforderung. Daher sind neuartige Modelle entwickelt worden, in denen Vereinfachungen der Koaleszenztheorie eingebaut sind. Sie lassen den Prozess der Artenbildung, auch der unsrigen Art vor etwa sechs Millionen Jahren, in neuem Licht erscheinen. Um die Modelle aber auf eine Vielzahl von Organismen anwenden zu können, müssen sie komplexe demografische Entwicklungen mit unterschiedlichen Genomregionen verbinden können.
Modeling the evolution of full genomes in populations is a methodological challenge because of the large number of recombination and mutation events to be accounted for. For that purpose, new models have been developed that introduced simplifications to the standard coalescent theory. When applied to closely related species, these models have shed new light on the speciation process that led to our own species, some 6 Million years ago. In order to be applied to a broader range of organisms, current models need to integrate complex demographic scenarios with heterogenous genomic landscapes.

Wie man Genome in Populationen modelliert

Ein Genom enthält die gesamte für die Entwicklung eines Individuums benötigte Information. Es stammt aus dem jeweiligen Erbgut seiner Eltern, unterscheidet sich aber wegen zweier grundlegender Mechanismen, die unweigerlich mit sexueller Fortpflanzung verbunden sind: Mutation und Rekombination. Während Mutationen in Keimzellen zufällige Veränderungen einbauen, verbindet die Rekombination zufällig Teile des jeweils ursprünglichen Erbguts der Eltern miteinander. Da sich diese Unterschiede mit der Zeit ansammeln, sind die Genome verwandtschaftlich nahestehender Personen ähnlicher als diejenigen entfernt verwandter Individuen. Genome enthalten daher auch Informationen über ihre eigene Entstehungsgeschichte. Man kann somit die Entstehung der Arten auch aus dem Grad der Ähnlichkeit ihres Erbguts ableiten.

Populationsgenetik untersucht, wie Gene innerhalb der Bevölkerung entstehen. Biologische Modelle können die Entstehung von Genen und Allelen in einer oder mehreren Populationen über die Zeit beschreiben. Als Grundlage hierfür dienen Mutationen, Rekombinationen und der Vorteil, der genau diese neue Genvariante seinen Trägern verschafft - auch relative Fitness genannt. Die Anzahl der Nachkommen eines Individuums, die als eine Komponente seiner Fitness zählt, ist aber nicht vollständig durch dessen Gene bestimmt, sondern sie erfolgt zu einem großen Teil auch zufällig, um Beispiel durch Partnerwahl, historische Aspekte der gegebenen Population, etc.. Somit wird die Evolution von Genen und letztlich des gesamten Erbguts am Ende von zufälligen Effekten bestimmt, die auch als Gendrift bezeichnet werden. Die einfachsten Modelle für die Genomentstehung in der Bevölkerung müssen daher drei Mechanismen berücksichtigen: Mutation, Rekombination und Gendrift.

Die sogenannte Koaleszenztheorie beschreibt auf mathematische Weise, wie einzelne Gene verschiedener Individuen miteinander verwandt sein können. Es ist eine große Herausforderung, diese Modelle auf vollständige Genome anzuwenden, da der Prozess der Rekombination das Erbgut in ein Mosaik von Segmenten mit unterschiedlichen, aber nicht unabhängigen Hintergrundinformationen zerstückelt. Mehrere klassische Modelle wurden dahingehend erweitert, dass die Entwicklung genomweiter Sequenzen in Populationen oder eng verwandter Arten nun unter dem Einfluss von Rekombination dargestellt wird. Um die Berechnungen vereinfachen zu können, basieren diese Erweiterungen alle auf einer gemeinsamen Schätzung, inwieweit die Rekombination das Genom beeinflusst. Der Prozess, der sich daraus ergibt, wird Markov-Kette genannt: An jeder beliebigen Stelle des Genoms hängt die zugrunde liegende lokale Hintergrundinformation von den Verwandtschaftsverhältnissen der umliegenden Stellen ab. Somit kann man ein sehr praktisches und gut untersuchtes mathematisches Modell namens Hidden Markov Modell (HMM) anwenden, um die Gesamtheit der Rekombinationen eines Genoms darzustellen, die von außen betrachtet verborgen (hidden) ist. Ein erweiteres Modell, das sequentially Markov coalescent (SMC) [1] oder Coalescent Hidden Markov Modell (CoalHMM) [2] genannt wird, kann daraus abgeleitet werden.

Wie man die Stammesgeschichte aus dem Erbgut heutiger Arten ableiten kann

Der CoalHMM-Ansatz wurde auf eng miteinander verwandte Arten, wie Mensch, Schimpanse und Gorilla, angewendet. Diese Ansätze erlauben, zusätzlich zur Ableitung der Entstehungsgeschichte, die wir mit Schimpansen und Bonobos teilen [3], den Rekombinations-Stammbaum (ancestral recombination graph, ARG, Abb. 1) umzustellen. Dieser verdeutlicht die lokalen Verwandtschaftsverhältnisse jeder einzelnen Position im Erbgut sowie einen großen Teil der Rekombinationsereignisse, die in der Vergangenheit aufgetreten sind. Beim Vergleich von eng miteinander verwandter Arten tritt im Rekombinations-Stammbaum ein bestimmter Mechanismus auf, den Fachleute das incomplete lineage sorting (ILS) nennen: Manche DNA-Bereiche können sich am ähnlichsten sein, beispielsweise bei Mensch und Gorilla,, obwohl sie nicht zu den am engsten verwandten Arten gehören, hier: Menschen und Schimpansen.

<strong>Abb. 1</strong>: Oben: Schematische Darstellung eines Rekombinations-Stammbaums (ARG), der kurze Genomsegmente zeigt, in denen zwei Rekombinat Bild vergrößern
Abb. 1: Oben: Schematische Darstellung eines Rekombinations-Stammbaums (ARG), der kurze Genomsegmente zeigt, in denen zwei Rekombinationsereignisse stattgefunden haben (R1 und R2). Bei den Arten handelt es sich um Mensch (H), Schimpanse (C) und Gorilla (G). Der senkrechte Pfeil gibt die Zeit an, von der Gegenwart in die Vergangenheit. Unten: Die farbigen Felder repräsentieren die drei Genomregionen mit ihren entsprechenden Stammesgeschichten. Der ARG enthält alle Informationen der lokalen Verwandtschaftsverhältnisse der DNA sowie die Zeit und den Ort, an denen die Rekombination anhält. Der mittlere, rote Graph zeigt das incomplete lineage sorting (ILS), da die beiden untersuchten Sequenzen sich zwar am ähnlichsten sind, aber zu zwei Arten gehören, nicht allzu nah miteinander verwandt sind. [weniger]

Die Möglichkeit, den Rekombinations-Stammbaum und die Struktur des incomplete lineage sorting umstellen zu können, ist eine wesentliche Errungenschaft, weil es Aufschlüsse über die evolutionären Prozesse gibt, die in ursprünglichen Arten aufgetreten sind - darunter auch der Zeitpunkt, in dem sich die Arten Mensch und Schimpanse aufgespalten haben. Der Rekombinations-Stammbaum macht es auch möglich, Rückschlüsse auf die Rekombinationsmuster in der Stammart zu ziehen. Eine solche rekonstruierte Übersicht von Rekombinationsmomenten in den Vorfahren kann nun mit denen von heutigen Arten verglichen werden, um so die Entwicklung der Rekombination im Genom zu untersuchen. Im Vergleich zeigt sich, dass sich die Rekombinationsmomente im Menschen schneller entwickelt haben als im Schimpansen [4].

Bestimmte Kräfte können den Rekombinations-Stammbaum allerdings verfälschen. Das kann dazu führen, dass die lokale Genvielfalt kleiner wird - oder aber in einigen Fällen viel zu groß wird. Zwei selektive Mechanismen sind dafür bekannt, sich auf die Vielfalt des Genoms auszuwirken. Schädliche Mutationen werden aus Populationen entfernt, da ihre Träger keine oder nur wenige Nachkommen haben; ein Phänomen, das als natürliche Selektion bezeichnet wird. Natürliche Selektion betrifft nicht nur die DNA-Stellen, in denen die Mutation auftritt. Es werden auch Allele, die mit ihnen verknüpft sind, entfernt. Die genetische Vielfalt ist somit an solchen natürlich selektierten Positionen kleiner. Diesen Prozess nennen Fachleute background selection. Ein weiteres Phänomen tritt auf, wenn bestimmte Gen-Varianten bevorzugt werden, weil sie einen Vorteil für ihre Träger bringen. Sie können sich schnell in einer Population anreichern und ausbreiten, weil sie nahe gelegene Genabschnitte gerichtet verdrängen. Man spricht vom selective sweep (sweep für Auskehren oder Verdrängen).

Es ist bekannt, dass background selection in vielen ursprünglichen Arten Spuren im Genom hinterlässt [3, 5]. Vor kurzem wurde festgestellt, dass das X-Chromosom des gemeinsamen Vorfahren von Mensch und Schimpanse große Regionen enthält, in denen das incomplete lineage sorting verloren gegangen ist. In diesen Regionen ist das Erbgut von Mensch und Schimpanse fast immer ähnlicher als das von Mensch und Gorilla. Dies ist eine unerwartete Beobachtung, wenn man Gendrift als einzige treibende Kraft ansieht, weil die Aufspaltung von Mensch, Schimpanse und Gorilla nämlich dicht beieinander liegt (Abb. 2). Dennoch lässt sich daraus schließen, dass sich die genetische Vielfalt im gemeinsamen Vorfahren von Mensch und Schimpanse verkleinert hat.

<strong>Abb. 2</strong>: Muster eines <em>incomplete lineage sorting</em> anhand der Ausrichtung des X-Chromosoms von Mensch, Schimpanse und Gorilla. Bild vergrößern
Abb. 2: Muster eines incomplete lineage sorting anhand der Ausrichtung des X-Chromosoms von Mensch, Schimpanse und Gorilla. Die Analyse ergab acht große DNA-Abschnitte, bei denen besonders auffällig ist, dass der Mechanismus des incomplete lineage sorting fast vollständig fehlt. Die Region 5 enthält das Centromer, für die keine Angleichung vorhanden war, weshalb sie in 5a und 5b aufgeteilt wurde. Jeder Punkt steht für einen Abschnitt von 100 Kilobasenpaaren. Die blauen Boxen im unteren Bereich des Graphs zeigen Regionen in europäischen (EUR) und asiatischen (ASN) Bevölkerungsgruppen, in denen keinerlei Überbleibsel des Neanderthaler-Genoms vorhanden ist, wie in [6] beschrieben. Daten und Methoden werden in [7] genauer beschrieben. [weniger]

Das Fehlen des incomplete lineage sorting in so großen Regionen kann jedoch nicht allein durch genetische Drift erklärt werden. So zeigen die Autosomen ein wesentlich gleichmäßigeres Muster des incomplete lineage sorting mit vergleichsweise kleineren und weniger Regionen, die eine geringere Genvielfalt aufweisen. Demnach müssen selektive Kräfte in diesen Regionen offenbar eine große Rolle spielen. Es konnte errechnet werden, dass einzig und allein mit der grundlegenden Selektion das zu beobachtende Muster auf dem X-Chromosom nicht erklärt werden kann. In ähnlicher Weise zeigten Simulationen, dass ein einziger selective sweep den Verlust des incomplete lineage sorting in größeren DNA-Abschnitten ebenso nicht erklären kann. Es wird daher angenommen, dass wiederkehrende selective sweeps in jeder dieser Regionen des X-Chromosoms aufgetreten sein müssen.

Interessant hierbei ist, dass diese Regionen im X-Chromosom des gemeinsamen Vorfahren von Mensch und Schimpanse deutlich mit denjenigen untersuchten Regionen überlappen, die keinerlei Überbleibsel von Neanderthaler-DNA aufweisen ([6]; Abb. 2). Es wird daher vermutet, dass diese Regionen beteiligt waren, als sich reproduktive Barrieren zwischen unseren Vorfahren und denen der Schimpansen gebildet haben. Sie korrelieren auch mit DNA-Abschnitten in modernen menschlichen Populationen, die für eine geringere Vielfalt verantwortlich sind [7]. Viel überraschender aber ist, dass eine erheblich verkleinerte Genvielfalt auch an der gleichen Position in mehreren anderen Menschenaffenarten beobachtet werden kann [7, 8]. Das bedeutet, dass diese bestimmten Regionen auch eine Rolle gespielt haben, als sich weitere Primatenarten aufgespalten haben. Es ist nun eine große Aufgabe, die molekularen Mechanismen zu entschlüsseln, die an der Entstehung der selective sweeps beteiligt sind, um auch die Entstehungsgeschichte unserer eigenen Art und ihre Verwandtschaftsverhältnisse zu den Menschenaffen besser verstehen zu können. Aktuelle Hypothesen hierzu beschäftigen sich mit der gerichteten Selektion, darunter auch dem genetischen Unterschied zwischen den Geschlechtern [7].

Wie man unterschiedliche genomische Landschaften mit realistischen Bevölkerungsentwicklungen verknüpfen kann

Die Erstellung bisheriger Modelle war darauf konzentriert, komplexe Bevölkerungsentwicklungen einzubinden, um beispielsweise die Bevölkerungsstruktur und Zu- bzw Abwanderungen zu erklären [9]. Diese Modelle gehen jedoch davon aus, dass alle Kräfte gleichmäßig auf das Genom wirken, was ganz eindeutig im Widerspruch zu unserem derzeitigen Wissen über die Biologie der Erbsubstanz vieler Arten steht. Mutation, Rekombination und Selektion können ganz beträchtlich zwischen den einzelnen Regionen eines bestimmten Genoms variieren (Abb. 3).

<strong>Abb. 3</strong>: Weit über Nicht-Primaten-Modelle hinaus zeigen auch Organismen wie pilzliche Krankheitserreger verdichtete und vielfältige Ge Bild vergrößern
Abb. 3: Weit über Nicht-Primaten-Modelle hinaus zeigen auch Organismen wie pilzliche Krankheitserreger verdichtete und vielfältige Genome. Dies wird hier anhand der durchschnittlichen Rekombinationsrate des Weizenpathogens Zymoseptoria tritici beispielhaft dargestellt.

Daher ist es für das Berechnen von biologischen Modellen, die Genome in der Bevölkerung abbilden, eine neue Herausforderung, zusätzlich zu realistischen Bevölkerungsentwicklungen auch die unterschiedlichen genomischen Landschaften zu erklären. Neue Modelle, die solche Unterschiede berücksichtigen, sind aber eine Voraussetzung dafür, die Entwicklungsgeschichte vieler Organismen besser verstehen zu können und sind daher die primären Forschungsziele der Forschergruppe Molekulare System Evolution am Institut.

Literaturhinweise

1.
McVean, G.A.T.; Cardin, N.J.
Approximating the coalescent with recombination
DOI
2.
Dutheil, J.Y.; Ganapathy, G.; Hobolth, A.; Mailund, T.; Uyenoyama, M.K.; Schierup, M.H.
Ancestral population genomics: The coalescent hidden Markov model approach
DOI
3.
Scally, A.; Dutheil, J.Y.; Hillier, L.W.; Jordan, G.E.; Goodhead, I.; Herrero, J.; Hobolth, A.; Lappalainen, T.; Mailund, T.; Marques-Bonet, T.; McCarthy, S.; Montgomery, S.H.; Schwalie, P.C.; Tang, Y.A.; Ward, M.C.; Xue, Y.; Yngvadottir, B.; Alkan, C.; Andersen, L.N.; Ayub, Q.; Ball, E.V.; Beal, K.; Bradley, B.J.; Chen, Y.; Clee, C.M.; Fitzgerald, S.; Graves, T.A.; Gu, Y.; Heath, P.; Heger, A.
Insights into hominid evolution from the gorilla genome sequence
DOI
4.
Munch, K.; Mailund, T.; Dutheil, J.Y.; Schierup, M.H.
A fine-scale recombination map of the human-chimpanzee ancestor reveals faster change in humans than in chimpanzees and a strong impact of GC-biased gene conversion
DOI
5.
Hobolth, A.; Dutheil, J.Y.; Hawks, J.; Schierup, M.H.; Mailund, T.
Incomplete lineage sorting patterns among human, chimpanzee, and orangutan suggest recent orangutan speciation and widespread selection
DOI
6.
Sankararaman, S.; Mallick, S.; Dannemann, M.; Prüfer, K.; Kelso, J.; Pääbo, S.; Patterson, N.; Reich D.
The landscape of Neanderthal ancestry in present-day humans
DOI
7.
Dutheil, J.Y.; Munch, K.; Nam, K.; Mailund, T.; Schierup, M.H.
Strong selective sweeps on the X chromosome in the human-chimpanzee ancestor explain its low divergence
DOI
8.
Nam, K.; Munch, K.; Hobolth, A.; Dutheil, J.Y.; Veeramah, K.; Woerner, A.; Hammer, M.F.; Great Ape Genome Diversity Project; Mailund, T.; Schierup, M.H.
Extreme selective sweeps independently targeted the X chromosomes of the great apes
DOI
9.
Steinrücken, M.; Paul, J.S.; Song, Y.S.
A sequentially Markov conditional sampling distribution for structured populations with migration and recombination
DOI
 
loading content