Korrespondierender Autor

Prof. Dr. Diethard Tautz
Telefon:+49 4522 763-390

Evolutionary Biology • Genetics

Research report (imported) 2018 - Max Planck Institute for Evolutionary Biology

Evolution von Genen aus Zufallssequenzen

Evolution of genes from random sequences

Authors

Tautz, Diethard

Departments

Evolutionsgenetik

DOI

10.17617/1.6C

Wie entstehen in der Evolution neue Gene? Lange nahm man an, dass dies nur durch Duplikation und Rekombination existierender Gene möglich ist. Ein Evolutionsexperiment zeigt nun, dass ein großer Teil zufällig zusammengesetzter Proteine das Wachstum von Zellen positiv oder negativ beeinflussen kann. Mit diesem Ergebnis lässt sich erklären, wie Gene auch aus nicht-kodierender DNA im Genom entstehen können. Gleichzeitig eröffnet sich damit eine praktisch unerschöpfliche Quelle für neue bioaktive Moleküle für pharmakologische und biotechnologische Anwendungen.
How can new genes evolve? It was long thought that this happens only through duplication and recombination of existing genes. An experimental evolution approach now shows that a large fraction of randomly composed protein sequences can positively or negatively influence the growth of cells. These results indicate how new genes can also arise out of non-coding sequences of the genome. Concurrently, this opens a practically unlimited source of new bioactive molecules for pharmacological and biotechnological applications.

Entstehung neuer Gene

Die Genome höherer Organismen enthalten rund 20.000 bis 40.000 Gene, die transkribiert werden und unterschiedliche Proteine kodieren. Viele dieser Gene haben einen gemeinsamen evolutionären Ursprung, der sich aus Sequenzähnlichkeiten ablesen lässt. Aber für circa ein Drittel der Gene ist dies nicht der Fall, sie werden nur in einzelnen evolutionären Linien gefunden. Da ihr genauer Ursprung unklar ist, werden sie meist als Waisen, im englischen als orphans, bezeichnet.

Die Frage, wie neue Gene entstehen und sich evolutionär weiter entwickeln können, wird seit fast einhundert Jahren diskutiert. Grundsätzlich sind zwei Möglichkeiten denkbar. Die erste besagt, dass neue Gene durch Verdopplung bereits vorhandener Gene entstehen. Nach einer solchen Verdopplung kann eine Kopie die ursprüngliche Funktion aufrechterhalten, während die zweite Kopie Mutationen ansammelt, die dann letztlich zu einer neuen Funktion des Genprodukts führen können. Die zweite Möglichkeit ist, dass neue Gene aus nichtkodierenden Bereichen des Genoms entstehen können. Die Genome höherer Organismen beinhalten nämlich neben den etablierten Genen auch sehr viel nicht-kodierende DNA, oft 90% und mehr. Wenn es innerhalb dieser Bereiche durch weitere Mutationen dazu kommt, dass ein Teil davon in RNA transkribiert wird, dann kann daraus potenziell eine neue Genfunktion entstehen.

Lange Zeit wurde angenommen, dass nur Duplikation und Divergenz zu neuen Genen führen kann. Duplikationen innerhalb von Chromosomen wurden schon Anfang des letzten Jahrhunderts beschrieben und mit der Entschlüsselung des genetischen Codes fand man, dass viele Gene in Genfamilien zusammengefasst werden können. Detaillierte Analysen zeigen, dass es nur rund 2000 Protein-Domänen gibt, die in verschiedenen Kombinationen wiederholt in mehreren Genen auftauchen. Solche Domänen bestehen aus circa 50 bis 100 Aminosäuren und nehmen bestimmte Faltungsstrukturen ein. Sie können sich auf verschiedene Art und Weise duplizieren und kombinieren und bilden damit sozusagen die Bausteine eines Genbaukastens. Im Jahr 1977 deklarierte der französische Nobelpreisträger Francois Jacob diese Art der Genentstehung zum generellen Prinzip [1]. In seinem Artikel "Evolution and tinkering" formulierte er, dass in der Natur Neues nur durch die Duplikation von Altem entsteht. Insbesondere schloss er aus, dass aus Zufalls-Sequenzen neue Informationen entstehen können. Denn wenn man die Größe einer Proteindomäne beispielsweise mit 75 Aminosäuren annimmt und in der Natur zwanzig verschiedene Aminosäuren genutzt werden, ergeben sich 2075 Kombinationsmöglichkeiten. Das ist eine Zahl, die größer ist als die geschätzte Zahl der Atome im Universum - wie sollte also da durch Zufall eine bestimmte funktionale Gensequenz entstehen? Wenn aber Neues nur aus der Kombination von Altem entsteht, dann lautet die berechtigte Frage, woher das "Alte" eigentlich kommt. Jacob schlug vor, dass es in der Anfangszeit der Entstehung des Lebens biochemische Bedingungen gegeben haben muss, die es erlaubten, dass diese ersten Bausteine des Lebens entstanden.

Diesen an sich schlüssigen Überlegungen stehen jetzt aktuelle Befunde entgegen, nämlich dass es dennoch auch zur de novo Evolution von neuen Genen aus nicht-kodierenden Sequenzen kommen kann [2, 3]. Tatsächlich steckt in der Überlegung ein Denkfehler. Denn obwohl es eine scheinbar unendlich große Kombinationsmöglichkeit von Aminosäuren gibt, könnte es sein, dass ein großer Anteil dieser Kombinationen bereits bestimmte Funktionen besitzt. Forscherinnen und Forscher der Abteilung für Evolutionsgenetik haben daher ein Evolutionsexperiment durchgeführt, in dem die Frage gestellt wurde, welcher Anteil von Zufallssequenzen vielleicht schon eine Funktion in Zellen hat [4].

Experimenteller Ansatz

Das Experiment wurde mit Bakterien (Escherichia coli) durchgeführt. Dazu wurde mithilfe eines Plasmid-Vektors eine Genbibliothek etabliert, die einige Millionen Varianten eines 65 Aminosäure langen Proteins exprimiert. Fünfzig der Aminosäuren innerhalb dieses Proteins bestanden aus Zufallssequenzen (Abb. 1). Diese Bibliothek wurde in die Zellen transformiert, sodass jede Zelle nur eine der Varianten exprimiert. Lässt man diese Zellen gemeinsam wachsen, dann würden alle Zellen, in denen die Expression des neuen Proteins keinen Einfluss hat, gleich schnell wachsen, während Zellen, in denen das neue Protein einen Vorteil oder Nachteil bringt, schneller oder langsamer wachsen.

<strong>Abb. 1: Experiment zur Expression von Proteinen mit zufälliger Sequenz. </strong>Im oberen Teil ist schematisch die Konstruktion des Vektors a Bild vergrößern
Abb. 1: Experiment zur Expression von Proteinen mit zufälliger Sequenz. Im oberen Teil ist schematisch die Konstruktion des Vektors abgebildet. Die Expression erfolgt durch einen induzierbaren Promotor. Der offene Leserahmen beginnt mit dem Startcodon M und drei weiteren vorgegeben Aminosäuren. Danach kommen 50 Aminosäuren in zufälliger Reihenfolge und zum Schluss weitere elf Aminosäuren mit vorgegebener Sequenz. Darunter sind 15 tatsächliche Sequenzen gezeigt, wobei die Punkte identische Aminosäuren aus der ersten Reihe symbolisieren. Rechts ist das Ergebnis eines der Experimente gezeigt. Die X-Achse repräsentiert den Grad der Veränderung im Wachstum der Klone (log2 Maßstab), die Y-Achse die relative Häufigkeit des Vorkommens eines Klons im Experiment (log10 Maßstab). Rot sind diejenigen Klone dargestellt, die eine signifikante Verlangsamung des Wachstums zeigen, und grün diejenigen Klone, die eine signifikante Beschleunigung des Wachstums zeigen. Klone ohne signifikante Veränderung sind schwarz dargestellt. [weniger]

Das Experiment wurde in sieben Variationen wiederholt und ergab sehr konsistente Ergebnisse. Bis zu 52% der Sequenzen hatten einen negativen Effekt auf das Wachstum, bis zu 25% aber hatten einen positiven Effekt. Dies lässt darauf schließen, dass Zufallssequenzen tatsächlich oft eine Funktion in der Zelle haben können, die für die evolutionäre Fitness relevant ist. Die oben angestellte Rechnung ist daher zu relativieren: Es ist durchaus zu erwarten, dass aus nicht-kodierenden Regionen des Genoms Gene mit neuer Funktion entstehen können. Interessanterweise ergab ein vergleichbares Experiment mit der Modellpflanze Arabidopsis ein sehr ähnliches Ergebnis [5].

Ausblick

Mit dem Nachweis, dass Zufallssequenzen von Proteinen einen Effekt auf Wachstum und Zellteilung haben können, kann die Evolution der orphan Gene erklärt werden. Zudem ergeben sich auch praktische Konsequenzen. Bisher basiert ein Großteil der pharmakologischen Wirkstoff-Forschung auf dem Screening von chemisch synthetisierten Molekülen. Mit der Entdeckung der Funktionalität biologisch hergestellter Zufallssequenzen erschließt sich eine neue, nahezu unendliche Quelle von möglichen neuen Wirkstoffen. Zum Beispiel könnten negativ wirkende Proteine als Antibiotika oder Zytostatika fungieren und positiv wirkende Proteine die Ausbeute biotechnologischer Verfahren erhöhen.

Literaturhinweise

1.
Jacob, F.
Evolution and tinkering
2.
Heinen, T. J.; Staubach, F.; Häming, D.; Tautz, D.
Emergence of a new gene from an intergenic region
DOI
3.
Tautz, D.; Domazet-Lošo, T.
The evolutionary origin of orphan genes
DOI
4.
Neme, R.; Amador, C.; Yildirim, B.; McConnell, E., Tautz, D.
Random sequences are an abundant source of bioactive RNAs or peptides
DOI
5.
Bao, Z.; Clancy, M. A.; Carvalho, R. F.; Elliott, K.; Folta, K. M.
Identification of novel growth regulators in plant populations expressing random peptides
DOI
 
Go to Editor View
loading content