Vermutlich habt ihr alle schon einmal vom Human Genome Project gehört. Es war ein großes Projekt mit dem Ziel, das komplette menschliche Erbgut zu sequenzieren. Und das gelang auch – nach etwa 13 Jahren und Kosten von über 2 Milliarden US-Dollar war die menschliche DNA im Grunde genommen vollständig sequenziert (und im Grunde genommen vollständig heißt hier zu etwa 85% vollständig).

Aus heutiger Perspektive wirkt dieser Aufwand geradezu lächerlich. Inzwischen ist es möglich, ein komplettes menschliches Genom in mehreren Stunden bis Tagen und für einige hundert Dollar zu sequenzieren.

Die DNA-Sequenzierung hat also eine ziemlich steile Entwicklung hinter sich. Das sollte wenig verwunderlich sein, denn die eigentlich so „simple“ Aufgabe, die Basenreihenfolge von DNA zu bestimmen, ist aus extrem vielen Wissenschaftszweigen und auch der modernen Medizin nicht mehr wegzudenken. In diesem Beitrag möchte ich diese Entwicklung nachvollziehen und dann die (meiner Meinung nach) spannendsten neuen Entwicklungen vorstellen.

Was ist eine DNA-Sequenz?

Hier möchte ich kurz klären, dass wir alle auf dem gleichen Wissensstand sind, was DNA angeht. Wenn ihr euch also mit dem Aufbau von DNA auskennt, könnt ihr diesen Abschnitt einfach überspringen.

DNA steht für Desoxyribonukleinsäure. Sie besteht aus Nukleotiden, die wiederum aus einer Nukleobase, einem Zuckermolekül namens Desoxyribose und einer Phosphatgruppe aufgebaut sind. Die Basen (A, C, T und G) sind der Teil, der tatsächlich die Information trägt. Die Basenabfolge bestimmt die Funktion des jeweiligen DNA-Abschnitts und wird als die Sequenz der DNA bezeichnet. Wenn ich wissen will, welche Informationen ein DNA-Abschnitt trägt, muss ich die Basenfolge herausfinden, sprich sequenzieren.

Aufbau eines DNA-Strangs. An dem Zucker-Phosphat-Rückgrat hängen die vier Basen Cytosin (C), Guanin (G), Adenin (A) und Thymin (T). Dieser DNA-Abschnitt hätte also die Sequenz CGAT.

Frederick Sanger – Godfather of Sequencing

Frederick Sanger ist einer von nur zwei Menschen, die zwei Chemie-Nobelpreise erhalten haben (zusammen mit K. Barry Sharpless, der den Chemie-Nobelpreis 2022 bekommen hat). Sanger hat beide Preise für Sequenzier-Techniken erhalten. Den ersten Nobelpreis gab es für seine Protein-Sequenzierungen. Unter anderem veröffentlichte er als erstes die Aminosäuresequenz von Insulin. Den zweiten Preis bekam er dann für seine DNA-Sequenzierung.

Frederick Sanger

Diese Sanger-Sequenzierung wird heute noch viel eingesetzt. Der größte Unterschied zu früher ist wohl die Automatisierung. Während damals viel Handarbeit nötig war, laufen der Prozess und die Auswertung inzwischen größtenteils automatisch ab.

Die Sanger-Sequenzierung ist toll. Sonst würde sie auch nicht mehr verwendet werden. Sie hat eine ziemlich kleine Fehlerrate und man kann relativ lange DNA-Sequenzen am Stück sequenzieren (bis zu 1000 bp (bp steht für Basenpaare und ist die typische Einheit, in der die Länge von DNA angegeben wird)). Wenn ich zum Beispiel bei meiner Arbeit ein Gen kloniert habe, und wissen möchte, ob da alles so stimmt, wie ich es mir vorstelle, lasse ich dieses Gen mit Sanger-Sequenzierung sequenzieren. „Meine“ Gene sind relativ kurz, sodass zwei Sequenzier-Läufe normalerweise ausreichen, um die ganze Länge des Gens abzudecken. Und zwei Sanger-Läufe sind auch schnell erledigt, das Ergebnis kommt direkt am nächsten Tag per Mail.

Aber wie man am Human Genome Project sieht, ist die Sequenzierung eines ganzen Genoms mittels Sanger-Sequenzierung ganz schön aufwändig. Wenn man also an mehr als ein paar Sequenzen einzelner Gene interessiert ist, ist man mit einer anderen Technik oftmals gut beraten.

Die nächste Generation

Zur nächsten Generation an Sequenziertechniken, nachvollziehbarerweise next generation sequencing (NGS) genannt, gehört die Illumina Sequenzierung. Für die Sequenzierung von großen Mengen DNA ist das inzwischen die Methode der Wahl. Illumina-Sequencing erlaubt die Sequenzierung von vielen Genen gleichzeitig, was bei großen Probenmengen die benötigte Zeit und den benötigten Aufwand natürlich deutlich reduziert. Für wenige Gene ist und bleibt Sanger jedoch schneller und günstiger.

Über Illumina-Sequenzierung möchte ich aber eigentlich gar nicht so viele Worte verlieren. Es gäbe zwar viel zu erzählen, aber ich möchte mich auf zwei Techniken beschränken, die noch neuer sind. Die werden manchmal third generation sequencing genannt, fallen aber oft auch unter NGS (was, wie ich finde, schon etwas verwirrend sein kann).

Winzig kleine Löcher

Wirklich spannend finde ich die Nanopore-Sequenzierung. Dabei handelt es sich im Prinzip um ein relativ einfaches Konzept, dass es aber tatsächlich erfolgreich umgesetzt wurde ist doch irgendwie beeindruckend.

Der Name verrät schon recht viel. Die Hauptrolle bei dieser Sequenziertechnik spielen nanometer-kleine Poren in einer Membran. Diese Membran teilt eine Kammer in zwei Hälften, in der sich ein Puffer und die DNA befinden. Da die Ionen des Puffers geladen sind, wandern sie durch die Poren in der Membran, wenn eine Spannung an die Kammer angelegt wird. Daraus resultiert ein Ionenstrom, der gemessen werden kann.

Jetzt können allerdings nicht nur die Ionen durch die Membran-Poren wandern, sondern auch die DNA. Und da die Poren nur wenige Nanometer klein sind (also wirklich sehr klein), blockiert sie bei ihrem Durchgang den Weg für viele der wandernden Ionen. Auch das lässt sich wiederum messen, als Abschwächung des Ionenstroms. Das würde jetzt erstmal nicht so viel bringen, so ließe sich ja nur messen, ob überhaupt DNA in der Probe ist. Aber die Basen der DNA sind unterschiedlich groß und blockieren unterschiedlich viel Fläche der Poren, sodass sich aus dem winzigen Unterschied in der Stromstärke die Base ableiten lässt, die gerade durch die Pore geht.

Schematischer Ablauf der Nanopore-Sequenzierung. ssDNA geht durch die Pore und die Veränderung des Ionenstroms wird gemessen. (Bildquelle: DataBase Center for Life Science (DBCLS) – CC BY 4.0)

Wie bei allem gibt es auch bei der Nanopore-Sequenzierung verschiedene Herangehensweisen. Mir als Biochemiker liegt der biologische Weg näher. Dabei werden Transmembranproteine als Poren verwendet, in einer Lipid-Membran. Damit ist das Ganze einer Zellmembran nicht unähnlich. Alternativ kann die Membran auch aus Metall bestehen, und die Poren sind einfache „Löcher“ in der Membran.

Mit dieser Technik lässt sich im Prinzip ein einzelner DNA-Strang sequenzieren, ohne ihn amplifizieren zu müssen. Außerdem lassen sich Geräte, die mit Nanopore-Sequenzierung arbeiten, einfach klein und tragbar gestalten und können Ergebnisse in Echtzeit anzeigen. Zwar ist die Illumina-Sequenzierung noch immer die häufigste Variante, die Nanopore-Sequenzierung hat jedoch das Potenzial, sie abzulösen.

Ein winziges bisschen Licht

Mit ähnlichen Vorteilen kann das single-molecule real-time sequencing (SMRT) aufwarten (wie man bei dem Namen ja irgendwie schon erwarten könnte, mal wieder). Für die Echtzeitsequenzierung werden tatsächlich einzelne Polymerase-Enzyme mit einem einzelnen DNA-Strang kombiniert. Polymerasen sind Enzyme, die DNA vervielfältigen, wofür sie die entsprechenden Nukleotide benötigen. Diese Nukleotide sind bei der Echtzeitsequenzierung mit Fluoreszenzfarbstoffen modifiziert, so dass jedes Nukleotid (A, C, T und G) mit einer anderen Wellenlänge leuchtet.

Die Polymerase sitzt in etwas, das sich zero mode waveguide (ZMV) nennt. Wenn jetzt das einzelne DNA-Molekül (übrigens ssDNA) durch die Polymerase vervielfältigt wird, werden nacheinander die fluoreszierenden Nukleotide in den neu entstehenden DNA-Strang eingebaut und leuchten dabei in ihrer jeweiligen Wellenlänge. Bei dem Einbau-Prozess wird das Fluorophor dann allerdings abgespalten, sodass es abdiffundieren kann und das Leuchten aufhört.

Bei dem ZMV handelt es sich um ein wenige Nanometer kleines Loch (jaja, Déjà-Vu, ich weiß). Durch dieses kleine Loch lässt sich das winzige bisschen Licht detektieren, das die fluoreszierenden Nukleotide aussenden (mein physikalisches Wissen reicht aber lange nicht aus, um hier zu erklären wieso das so ist, also müsst ihr mir das jetzt einfach glauben). Aus der Reihenfolge der unterschiedlichen Wellenlängen, die detektiert werden, lässt sich dann auf die Reihenfolge der eingebauten Nukleotide schließen, und die Sequenz der template-DNA ist ermittelt.

Der Physik gehört die Zukunft

Das war mein kleiner Einblick in die Geschichte und Entwicklung der DNA-Sequenzierung. Aber ich habe hier wirklich nur an der Oberfläche gekratzt. Es gäbe noch so viel zu sagen, denn die Entwicklung, die dieses Feld in den letzten Jahrzehnten zurückgelegt hat, ist beeindruckend.

Die Sanger-Sequenzierung war, als sie noch nicht einmal automatisiert war, zwar eine Revolution, aber auch sehr aufwändig. Und heutzutage ist die Sequenzierung eines ganzen Genoms im Stunden-Maßstab überhaupt kein Problem mehr. Und vor allem ist die Sanger-Sequenzierung im Kern noch eine sehr molekularbiologische Methode, während nachfolgende Techniken immer mehr auf physikalischen Prinzipien beruhen. Gerade die dritte Generation mit der SMRT-Technologie, oder die Halbleitersequenzierung, die ich noch nicht erwähnt habe. Auf die Spitze getrieben wird das dann durch die Nanopore-Technik, die komplett ohne Amplifizierung der  DNA auskommt und nur noch auf biophysikalischen Prinzipien beruht. Aber ich schätze mal, zumindest was die DNA-Sequenzierung angeht, gehört der Physik wohl die Zukunft.