Das Zeitalter des Pangenoms ist angebrochen

Fr, 21.10.2022 — Ricki Lewis

Ricki LewisIcon Molekularbiologie

Nach der Entschlüsselung des menschlichen Genoms im Jahr 2001, wurden die hochfliegenden Erwartungen, man könne aus genetischen Veränderungen sehr bald Ursachen und Therapien für diverse Krankheiten entdecken, rasch enttäuscht. Nach der Analyse von zigtausenden unterschiedlichen Genomen stellt sich heraus, dass unser Erbgut viel stärker variiert als man bisher glaubte, und die Bedeutung einzelner Variationen unklar ist. Das Humane Pangenom-Projekt macht es sich zur Aufgabe die Variabilität des menschlichen Genoms zu kartieren und aus Sequenzanalysen von mehreren Hundert Menschen aus verschiedenen Weltregionen ein sogenanntes Referenz Genom zu erstellen, das Abweichungen in Zusammenhang mit physiologischen und pathologischen Unterschieden bringen kann. Die Genetikerin Ricki Lewis berichtet darüber.*

Die aus dem Griechischen stammende Vorsilbe "pan" bedeutet "alles, jedes, ganz und allumfassend". In der Sprache der Genetik ist das "menschliche Pangenom" mit "vollständige Referenz für die Diversität des menschlichen Genoms" zu übersetzen. Es ist als eine neue Art von Kartierung gedacht, die alle Variationen der Sequenz von 3.05 Milliarden DNA-Basenpaaren - den Bausteinen eines Genoms - darstellt, plus oder minus einiger weniger kurzer, sich wiederholender Sequenzen. Die Darstellung ist so dicht gepackt, dass sie einer Karte des New Yorker U-Bahn-Systems ähnelt.

In der Schaffung einer "Genom-Referenzdarstellung, die die gesamte menschliche Genomvariation erfassen und die Forschung über die gesamte Diversität der Populationen unterstützen kann" ist das Human Pangenome Reference Consortium federführend.

Eine solche Ressource ist natürlich längst überfällig. Jetzt, da bereits die Genome von mehr als 30 Millionen Menschen sequenziert worden sind, klingt es merkwürdig, von "dem" menschlichen Genom zu sprechen, so als wären wir alle identisch in Bezug auf jede der vier DNA-Basen - A, C, T oder G -, die jeden der 3 Milliarden Speicherplätze belegen. Wir sind keine Klone. Allerdings brauchen die meisten Biotechnologien etwa drei Jahrzehnte, um ausgereift zu sein, und da das Humangenom-Projekt Anfang der 1990er Jahre begonnen wurde, scheinen die Dinge nun genau im Zeitplan für eine umfassendere Betrachtung zu liegen.

Als ich Mitte der 1980er Jahre zum ersten Mal an Sitzungen teilnahm, auf denen die Idee der Sequenzierung des menschlichen Genoms aufkam, rechnete man damit, dass diese Aufgabe mindestens ein Jahrzehnt in Anspruch nehmen würde. Im ersten Entwurf der menschlichen Genomsequenz, die 2001 vom National Human Genome Research Institute (NHGRI) und seinen Partnern veröffentlicht wurde, stammten davon etwa 93 % von nur elf Personen, wobei 70 % vom gesamten von einem einzigen Mann kamen, der zu 37 % afrikanischer und zu 57 % europäischer Abstammung war. Das menschliche Genom, das von Celera Genomics veröffentlicht wurde, stammte Berichten zufolge von Craig Venter, dem Leiter dieses Unternehmens.

Danach begannen Genomsequenzen von Prominenten einzutrudeln, von anderen reichen Leuten, von einer Handvoll Journalisten, die Artikel und Bücher veröffentlichten, in denen sie ihr genetisches Selbst enthüllten, und von einer Reihe von "ersten Testpersonen" - Afrikanern, Han-Chinesen und mehreren Vertretern moderner Völker mit alten Wurzeln.

Es ist schon ein wenig verwunderlich, dass wir heute mit unseren Smartphones auf unsere Daten der Genomsequenzen zugreifen können.

Als das Humangenom-Projekt auslief, begannen die Forscher, die Diversität des menschlichen Genoms zu katalogisieren, indem sie im Genom einzelne Basen-Positionen identifizierten, die sich von Person zu Person unterscheiden. Dies sind sogenannte single nucleotid polymorphisms (Einzelnukleotid-Polymorphismen - SNPs). Als die Ansammlungen von SNPs auf den Chromosomen immer dichter wurden, erkannten die Forscher sehr rasch, dass es neuer Instrumente bedurfte, um die sich ausweitende Diversität unserer DNA darzustellen.

Trotz dieser Fortschritte in der Sequenzierung müssen wir aber noch viel über die genetische Diversität des Menschen lernen, und dazu sind Vergleiche erforderlich. Hier kommt das menschliche Pangenom ins Spiel.

Die Diversität unserer Genomsequenzen ist atemberaubend. Eine Studie der gesamten Genomsequenzen von 53.831 Menschen hat Unterschiede an 400 Millionen Positionen ergeben! Die meisten davon waren SNPs oder eine zusätzliche oder fehlende DNA-Base. Es kann aber sein, dass der Großteil unserer Variabilität von nur wenigen Menschen stammt. Etwa 97 Prozent der 400 Millionen unterschiedlicher Positionen stammten von weniger als einem Prozent der 53 831 Testpersonen, wobei 46 Prozent davon bei nur einer Person auftraten. Wir unterscheiden uns genetisch in vielerlei Hinsicht, und einige von uns unterscheiden sich stärker als andere, aber wir sind alle Menschen.

Einige Jahre lang haben Forscher "Referenz"-Genomsequenzen zusammen gestellt, um der Diversität in bestimmten Populationen Rechnung zu tragen. Diese digitalen Sequenzen zeigten an jeder Position die in vielen Genomen der Gruppe am häufigsten vorkommende häufigste DNA-Base an. Die Aktualisierung der Referenzgenome nahm jedoch viel Zeit in Anspruch und war eine undankbare Aufgabe, die nie abgeschlossen wurde. Um 2010, als weitere Daten von Asiaten und Afrikanern hinzu gekommen waren, blieben immer noch 5 Millionen Lücken in den Referenzsequenzen.

Da die Datenmengen schnell zu groß wurden, um die Diversität des Genoms mit einer einfachen, klaren visuellen Methode erfassen zu können, kam die Idee des menschlichen Pangenoms als "einer vollständige Referenz der Diversität des menschlichen Genoms" auf. Das Human Pangenome Project begann offiziell im Jahr 2019 und füllte innerhalb eines Jahres die verbleibenden Lücken in den Genomsequenzen. Ziel war es, die Genomsequenzen von zunächst 350 Menschen aus verschiedenen ethnischen Gruppen darzustellen, wobei "computational pangenomics"-Werkzeuge verwendet wurden, um visuelle Darstellungen, sogenannte "Genom-Graphen", zu erstellen.

In einem Genom-Graphen zeigen farblich gekennzeichnete Basen, die der DNA-Darstellung überlagert sind, wie sich die Menschen an den einzelnen Positionen unterscheiden. Wie eine geografische Karte mit Symbolen für Campingplätze, Rastplätze und interessante Orte zeigen Genom-Graphen die SNPs und auch fehlende Teile der Genomsequenz, zusätzliche Teile und invertierte Regionen an. Sie zeigen auch welche Bedeutung, welcher Zusammenhang damit verbunden ist, indem z. B. Gene, die für Proteine kodieren, von Kontrollsequenzen unterschieden werden und Positionen gekennzeichnet werden, an denen die DNA-Sequenz von verschiedenen Startpunkten aus gelesen werden kann, wodurch die Zelle die Anweisung erhält, unterschiedliche Proteine zu produzieren.

Die Daten, die in das menschliche Pangenomprojekt einfließen, stammen aus Bevölkerungs-Biobanken und verschiedenen Genomsequenzierungs-Projekten. Wenn all diese Informationen über die Länge der Chromosomen überlagert werden, beginnt der Genom-Graph tatsächlich einem U-Bahn-Plan zu ähneln.

Ich bin mit der New Yorker U-Bahn aufgewachsen. So wie die meisten Zuglinien im Zentrum der Stadt, in Manhattan, zusammenlaufen und sich nur wenige Linien in die Randbezirke erstrecken, so sind auch die proteinkodierenden Gene in Richtung des Zentromers jedes Chromosoms gruppiert und werden zu den Spitzen, den Telomeren, hin immer spärlicher.

Ich denke mit Rührung an die erste Humangenom-Tagung zurück, an der ich 1986, ich glaube in Boston, teilgenommen habe. Es ist eine lange, außergewöhnliche Reise geworden, aber wir fangen endlich an zu verstehen, wie eine Sprache mit vier Buchstaben die erstaunliche Vielfalt des menschlichen Wesens erklären kann.


* Der Artikel ist erstmals am 13.Oktober 2022 in PLOS Blogs - DNA Science Blog unter dem Titel " The Age of the Pangenome Dawns" https://dnascience.plos.org/2022/10/13/the-age-of-the-pangenome-dawns/ erschienen und steht unter einer cc-by Lizenz . Die Autorin hat sich freundlicherweise mit der Übersetzung ihrer Artikel durch ScienceBlog.at einverstanden erklärt, welche so genau wie möglich der englischen Fassung folgen.