Ein Blog über die Wissenschaft hinter Arzneimitteln

Tag: Arzneistofffindung

AlphaFold – Was kann die “Wunder-KI” wirklich?

Vor einigen Tagen wurde AlphaFold 3 veröffentlicht, ein KI-Werkzeug zur Vorhersage von Proteinstrukturen. Die Zeit schreibt dazu „Eine KI die wirklich hilft“ oder „KI sagt Struktur aller Moleküle des Lebens voraus“, der Standard nennt es die “Wunder-KI“. Auch in der Wissenschaft ist das Lob für die Fähigkeiten von AlphaFold groß, es gibt jedoch auch einige skeptische Stimmen.

Aber was ist AlphaFold eigentlich genau, was bringt es und was kann es wirklich? Darauf werde ich in diesem Text einen kritischen Blick werfen.

Wieso sind Proteinstrukturen so wichtig?

Eins erstmal vorneweg: AlphaFold und andere KIs zur Vorhersage von Proteinstrukturen sind extrem beeindruckend. Die dreidimensionale Struktur von Proteinen ist kompliziert, und eine Möglichkeit, sie verlässlich vorherzusagen, war lange ein unerfüllbarer Traum. Aber wie verlässlich sind diese KIs wirklich? Wie funktioniert das? Und vor allem, für was brauchen wir diese Proteinstrukturen überhaupt?

Beschäftigen wir uns zuerst mit der letzten dieser Fragen: Wofür brauchen wir die Struktur von Proteinen? Im Prinzip ist es ganz einfach, denn die Struktur bestimmt bei Proteinen zum Großteil die Funktion.

Proteine bestehen aus Aminosäuren, die eine hinter der anderen aufgereiht sind. Davon gibt es – mit ein paar Ausnahmen – 20 Stück. Würden die alle nur in einer langen Kette aneinander hängen, wären die möglichen Fähigkeiten von Proteinen sehr begrenzt. Wenn wir uns aber echte Proteine anschauen, können die jedoch sehr, sehr viel. Sie können als Enzyme biochemische Reaktionen katalysieren, sie können als Rezeptoren Botenstoffe erkennen, sie können als Transporter Stoffe über Zellmembranen transportieren und sie können Festigkeit und Halt geben – denkt da nur an eure Nägel.

Diese Fähigkeiten von Proteinen entstehen dadurch, dass ihre 3D-Struktur die richtigen Aminosäuren an die richtige Stelle bringt. Dort können sie dann miteinander und ihrer Umgebung interagieren und beispielsweise eine Bindetasche für andere Moleküle bilden.

Wenn wir also verstehen wollen, wie Proteine funktionieren – und das müssen wir vor allem auch, weil darauf die meisten unserer Arzneimittel basieren – müssen wir ihre Struktur verstehen.

Was ist AlphaFold 3?

Kommen wir jetzt zum „Star“ dieses Textes – AlphaFold. AlphaFold ist ein KI-Werkzeug zur a priori Vorhersage von Proteinstrukturen (seit AlphaFold 3 werden aber auch andere Biomoleküle wie z.B. DNA besser unterstützt). Aus der Aminosäure-Sequenz eines beliebigen Proteins kann also dessen Struktur vorhergesagt werden.

Überlagerung einer experimentellen Struktur (blau) des Proteins Albumin und Vorhersage von AlphaFold3 (gelb). Vorhersage und experimentelle Struktur stimmen ziemlich gut überein. (Struktur: PDB 1AO6, 10.1093/protein/12.6.439)

Diese Struktur kann dann zum Beispiel zur Entwicklung neuer Arzneistoffe verwendet werden. Denn gerade dafür braucht man oft ein genaues Bild davon, wie der Wirkstoff an das Protein bindet und mit welchen Aminosäuren er dort interagiert. Und man muss wirklich zugeben, dass AlphaFold erstaunlich gut ist. Wie schon gesagt ist die dreidimensionale Struktur von Proteinen eine komplizierte Angelegenheit und bei vielen Proteinen stimmen die Vorhersage und die experimentell bestimmte Struktur sehr gut überein. Allerdings ist AlphaFold lange nicht perfekt, auch nicht seit AlphaFold 3. Genauso wie es bestimmte Stärken hat, hat es auch Schwächen, die meiner Einschätzung nach sehr schwierig zu überwinden sein werden. Vieles davon wird in diesem Paper von 2023 schön zusammengefasst.

Unerwartetes entdecken

Einer der Hauptgründe, weshalb AlphaFold so gut ist, ist die Qualität der Trainingsdaten. Wie ChatGPT zum Beispiel ist AlphaFold auch ein sogenanntes large language model, also eigentlich ein Sprachmodell. Nur ist die Sprache, die AlphaFold spricht, eben keine Menschliche, sondern die „Sprache“ der Aminosäuren. Aber genau wie bei ChatGPT, das mit einer Unzahl von Texten trainiert wurde, braucht auch AlphaFold Trainingsdaten. Und hier hatten die Entwickler:innen enormes Glück, denn es existieren sehr viele, sehr gute experimentell bestimmte Proteinstrukturen, die frei zugänglich sind. Ohne diese Daten, die in Jahrzehnten strukturbiologischer Arbeit gewonnen wurden, wäre AlphaFold nicht möglich gewesen.

Das führt allerdings auch dazu, dass AlphaFold Schwierigkeiten damit hat, Unbekanntes oder Unerwartetes zu entdecken – es funktioniert ja auch durch den Vergleich mit bekannten Strukturen. Eine der großen Stärken experimenteller Methoden, solche unerwarteten Strukturmotive, Cofaktoren, Ionen oder Modifikationen zu entdecken ist damit eine der Schwächen AlphaFolds. Und die eigentlich unerwarteten Dinge sind eben oftmals die interessantesten.

Flexible Proteine sind ein Problem

Besonders gut sind die Vorhersagen von AlphaFold bei Proteinen (oder Teilen von Proteinen), die eine sehr stabile und gut definierte Struktur haben – so wie Helices und β-Faltblätter, für diejenigen von euch, die sich auskennen. Aber 30 % aller (eukaryotischer) Proteine besitzen Regionen, die man als intrinsically disordered bezeichnet und die im Prinzip gar keine festgelegte Struktur besitzen. Einige Protein sind sogar komplett intrinsically disordered und besitzen kaum stabile Strukturmotive. Solche flexiblen Proteine und Regionen bereiten der Strukturbiologie seit jeher Probleme, sei es experimentell oder via KI.

Vorhersage der Struktur des M2-Acetylcholinrezeptors. Die Farben stellen die Zuverlässigkeit der Vorhersage dar: blau – sehr hoch, hellblau – hoch, gelb – niedrig, orange – sehr niedrig. Die Zuverlässigkeit ist vor allem in gut strukturierten Bereichen hoch, während sie in flexiblen Bereichen niedrig bis sehr niedrig ist.

Es ist aber auch möglich, dass sich aus einer flexiblen Region kurzzeitig eine stabile Konformation (so werden definierte Proteinstrukturen auch bezeichnet) ergibt. Solche induzierten Konformationen entstehen häufig durch Wechselwirkungen mit z.B. anderen Proteinen. AlphaFold trifft seine Vorhersagen rein aus der Aminosäuresequenz eines Proteins und „weiß“ nichts über dessen physikochemische Eigenschaften. Es kann also auch nicht vorhersagen, welche Auswirkungen solche Wechselwirkungen auf die Struktur eines Proteins haben und erkennt die induzierte Konformation möglicherweise nicht.

Proteine sind ständig in Bewegung

Worauf physikochemische Wechselwirkungen noch einen großen Einfluss haben ist die Bewegung – die Dynamik – eines Proteins. AlphaFold liefert statische Bilder einer Proteinstruktur, aber eigentlich sind Proteine ständig in Bewegung und wechseln zwischen unterschiedlichen Konformationen hin und her. Das ist zum Beispiel der Fall, wenn ein Signalmolekül an ein Rezeptorprotein bindet; um dieses Signal weiterzuleiten muss der Rezeptor seine Struktur etwas verändern. Solche Unterschiede zwischen aktiver und inaktiver Form eines Proteins stellen für die Vorhersage der Struktur immer noch ein Problem dar und häufig erhält man eine Mischung aus beiden Möglichkeiten.

Überlagerung eines Proteinkomplex aus Vasopressin-Rezeptor 2 und beta-Arrestin 1 – beide Proteine sollten in einer aktiven Konformation sein. Die experimentell bestimmte Rezeptor-Struktur ist blau, die Vorhersage von AlphaFold 3 ist orange. Beide Arrestin-Strukturen sind grau. (Struktur: PDB 7R0C, 10.1126/sciadv.abo7761)

Auch andere Prozesse können dafür sorgen, dass Proteine ihre Struktur verändern. Posttranslationale Modifikationen – das „Dekorieren“ mit bestimmten chemischen Gruppen, nachdem die Aminosäuresequenz fertig ist gehört dazu, oder auch der pH-Wert. In bestimmten Bereichen einer Zelle herrschen andere pH-Werte und beeinflussen das Verhalten von Proteinen. Das kann AlphaFold jedoch auch nicht in jede seiner Vorhersage mit einkalkulieren.

(Not So) Open Science

Eine andere Sache, die ich an AlphaFold bedenklich finde, hat nichts mit dem Programm an sich zu tun, sondern mit den Unternehmen, die dahinter stehen. Wie Retraction Watch berichtet, haben Google und dessen Tochterunternehmen Deep Mind den Code (und die Trainingsdaten) von AlphaFold 3 nicht öffentlich gemacht – nicht einmal den Reviewern des Papers, das über die neue AlphaFold-Version berichtet. Es gibt zwar den AlphaFold-Server, den man für Simulationen mit AlphaFold 3 nutzen kann, allerdings nur für eine begrenzte Zahl an  Aufträgen pro Tag und nicht für alle Vorhersagen, die es kann – oder können sollte.

Das macht es nicht nur unmöglich, die Angaben über die Leistungsfähigkeit des Programms genau zu überprüfen, sondern widerspricht auch den Grundsätzen guter Wissenschaft. Daten und Code sollten für die Wissenschafts-Community zugänglich sein, um die Forschung möglichst weit voran zu bringen und Ergebnisse überprüf- und replizierbar zu machen.

Fazit: Was kann AlphaFold?

Das Ganze liest sich jetzt möglicherweise, als wäre ich kein allzu großer Fan von KI-Werkzeugen zur Vorhersage von Proteinstrukturen. Aber dem ist eigentlich nicht so – man muss sie nur als das betrachten, was sie sind. Nämlich Werkzeuge, mit ihren eigenen Einsatzgebieten, Stärken, Schwächen und Limitationen.

Ich wollte mit diesem Text einen eher kritischen Blick auf AlphaFold und Co. werfen, vor allem nach der extrem lobenden Berichterstattung der letzten Tage. Denn so gut AlphaFold auch ist – und es ist sehr gut – wird es nicht die experimentelle Strukturbiologie überflüssig machen oder uns im Rekordtempo einen neuen Arzneistoff nach dem anderen entwickeln lassen. Tatsächlich funktionieren AlphaFold-Vorhersagen für die Entwicklung neuer Arzneistoffe schlechter als solche, die auf experimentellen Daten basieren.

Stattdessen muss es sinnvoll in Arbeitsabläufe eingebunden werden. Seine Geschwindigkeit und Einfachheit muss verwendet werden, wenn sich aufwändige Experimente nicht lohnen. Experimente hingegen sind immer noch nötig, um neue und unerwartete Dinge zu entdecken – und um Vorhersagen überprüfen zu können. Aber richtig angewendet sind AlphaFold und Co. auf jeden Fall Werkzeuge, die in den Werkzeugkasten der Wissenschaft gehören und die anderen Werkzeuge darin gut ergänzen können.

Wenn euch dieser Text gefallen hast, abonniert doch gerne meinen Newsletter, um keinen neuen Beitrag mehr zu verpassen!

Von Regeln und Regelbrechern – Die Lipinski Rule of Five

In diesem Text geht es um ein klassisch pharmazeutisches Thema: Die Lipinski Rule of Five. Diese Regel beschreibt Eigenschaften, auf die man bei der Suche nach neuen Arzneistoffen achten sollte – und vereinfacht damit diese sehr komplexe Aufgabe. Aber ist die Rule of Five überhaupt eine Regel, der man blind folgen sollte? Oder schafft man damit neue Probleme, weil man andere lösen möchte?

Die Rule of Five

Die Lipinski Rule of Five wurde (wer hätte es gedacht) von Christopher Lipinski zusammen mit seinen Kolleg:innen Ende der 90er Jahre in diesem Paper beschrieben. Seither hatte diese Regel einen großen Einfluss darauf, wie wir denken, dass ein Arzneistoff zu sein hat. Genauer gesagt, ein Arzneistoff zur oralen Anwendung. Denn das ist das große Thema hinter der Rule of Five: Kann ein Arzneistoff über den Verdauungstrakt – und hier vor allem im Darm – aufgenommen werden? Und können wir das irgendwie abschätzen, ohne aufwändige Experimente machen zu müssen?

Lipinski et al. beschrieben, dass sie das mit nur vier einfachen Informationen abschätzen können: (1) Eine relative Molekülmasse von unter 500, (2) nicht mehr als 5 Wasserstoffbrücken-Donatoren, (3) nicht mehr als 10 Wasserstoffbrücken-Akzeptoren und (4) ein logarithmischer Oktanol-Wasser-Verteilungskoeffizient unter 5. Der Name Rule of Five kommt daher, dass alle diese Zahlen (500, 5, 10, nochmal 5) Mehrfache von 5 sind.

Das hört sich erstmal ganz schön chemisch an (und für manche damit überhaupt nicht einladend), und auch wenn es im Kern sehr chemisch ist, ist es dennoch relativ intuitiv, wenn wir verstehen, wie oral angewendete Arzneistoffe aufgenommen werden.

Was Arzneistoffe zur oralen Anwendung brauchen

Arzneimittel zur oralen Anwendung sind extrem wichtig. Sie sind einfach, zuverlässig und schnell anzuwenden, und das ist entscheidend, um Anwendungsfehler zu verhindern und die Therapietreue bei Patient:innen sicherzustellen. Aber damit ein Arzneimittel oral angewendet werden kann, muss der enthaltene Arzneistoff irgendwie im Verdauungstrakt aufgenommen werden können. Dafür muss er einige Barrieren überwinden, die – etwas vereinfacht – aus den Zellmembranen der Darm- und Magenschleimhaut bestehen. Wenn ihr mehr darüber wissen wollt, lest doch gerne meinen Beitrag zur Pharmakokinetik (mein allererster Blogbeitrag übrigens).

Das Problem ist jetzt, dass der Arzneistoff dafür einen ziemlichen Balanceakt hinlegen muss. Denn der Magen- und Darminhalt besteht vor allem aus Wasser, und damit ein Arzneistoff resorbiert werden kann, muss er sich erst darin lösen. Danach muss er die Zellmembranen durchdringen, die sehr lipophil sind, wofür der Arzneistoff also eher fettlöslich sein sollte. Ein Arzneistoff muss also wasserlöslich genug sein, aber auch nicht zu wasserlöslich. Tatsächlich ist es klassischerweise am besten, wenn der Arzneistoff relativ klein und eher lipophil ist.

Wie ermöglichen jetzt unsere vier eher simplen Informationen, diesen komplexen Vorgang abzuschätzen?

Das Molekulargewicht ist ein Maß für, naja, die Größe des Arzneistoffs. Denn je größer er ist, desto schwerer soll es für ihn sein, Zellmembranen zu überwinden.

Wasserstoffbrücken sind Interaktionen des Arzneistoffs mit polaren Molekülen – in diesem Kontext also vor allem Wasser. Je mehr davon, desto schwerer wird es für den Arzneistoff, lipophile Membranen zu durchdringen. (Kurz gesagt: Durch den Gewinn an Bindungsenthalpie durch die H-Brücken ist es energetisch am günstigsten, wenn alle H-Brücken-Donatoren und -Akzeptoren abgesättigt sind, was innerhalb der Membran natürlich nicht möglich ist.)

Der Oktanol-Wasser-Verteilungskoeffizient beschreibt, welcher Teil eines Stoffes in einer unpolaren Oktanol-Phase zu finden ist, und welcher Teil in einer polaren Wasser-Phase. Damit sagt er etwas über die generelle Lipophilie aus. Ein oraler Arzneistoff sollte zwar eher lipophil sein, aber auch nicht zu sehr, daher sollte der logarithmische Verteilungskoeffizient 5 nicht überschreiten.

Die Alternativen

In den etwas mehr als 20 Jahren seit Veröffentlichung der Rule of Five hat sie sich als sehr nützlich erwiesen. Aber es gab auch Kritik, und Verbesserungsvorschläge. Ich möchte auf die Erweiterungen der Rule of Five gar nicht genauer eingehen. Die Grenzwerte werden präzisiert und es geht außerdem um Faktoren wie die Anzahl drehbarer Bindungen oder die Größe der polaren Oberfläche.

Da die Rule of Five nicht als in Stein gemeißelte Regel, sondern eher als grobe Richtlinie zu verstehen ist, gibt es natürlich auch diverse Arzneistoffe, die gegen sie verstoßen, und trotzdem sehr gut funktionieren. Wie kann das sein?

Die offensichtliche Antwort auf diese Frage sind alternative Wege, die Schleimhäute des Verdauungstrakts zu überwinden. Denn schließlich ist der Verdauungstrakt dazu da, Nährstoffe aufzunehmen, und die halten sich auch nicht alle an die Rule of Five. Daher gibt es Transportproteine in den Zellmembranen, die die Aufnahme dieser Nährstoffe ermöglichen, und das können manche Arzneistoffe ausnutzen. Sie sind ebenfalls Substrate dieser Transporter und können daher resorbiert werden, ohne tatsächlich die Phospholipid-Doppelschicht der Zellmembran zu überwinden. Einige häufig benutzte Arzneistoffe sind gute Beispiele dafür: L-Dopa (bei Parkinson), Metformin (bei Diabetes) oder Simvastatin (zur Senkung des Cholesterinspiegels).

Außer der Aufnahme über Transportproteine gibt es auch noch die Möglichkeit, dass Arzneistoffe sich quasi zwischen zwei Zellen hindurch schleichen – das nennt man dann parazelluläre Resorption. So müssen sie die Membran auch nicht überwinden, allerdings ist das nur für kleine Moleküle möglich und auch nicht in allen Bereichen des Körpers.

Regelbrecher

In einem Paper von 2016 haben die Autor:innen die Resorption von Stoffen untersucht, die gegen die Rule of Five verstoßen. Dazu verwendeten sie ein Modellsystem aus Liposomen – im Prinzip kleine Kugeln aus einer oder mehreren Phospholipid-Membranen, ähnlich der Zellmembran – um die Permeation der Stoffe durch eine Membran zu betrachten. Und tatsächlich konnten die beiden Arzneistoffe Tetrazyklin und Rifampicin, die ziemlich heftig gegen die Rule of Five verstoßen, die Membranen überwinden (und zwar rein durch passive Diffusion und nicht durch andere Transportmechanismen).

Die Autor:innen haben einige Faktoren ausmachen können, wie solche „Regelbrecher“ trotzdem oral resorbiert werden können.

Struktur von Tetrazyklin

Tetrazyklin besitzt mehr Wasserstoffbrücken-Donatoren als „erlaubt“. Diese können aber intramolekulare Wasserstoffbrücken bilden, also mit Wasserstoffbrücken-Akzeptoren im gleichen Molekül. Damit sind diese abgesättigt und „zählen nicht mehr“ für die Membran-Permeation. Außerdem hat auch die Form eines Arzneistoffs einen Einfluss auf die Fähigkeit, Membranen überwinden zu können. Tetrazyklin ist lang und schmal und könnte daher mit weniger sterischer Hinderung durch eine Membran diffundieren können – das heißt, es braucht einfach weniger Platz und kann sich deshalb besser durch die dicht gepackte Membran bewegen.

Ein großes Thema ist auch die Ladung eines Arzneistoffes, über das ich bisher aber noch nicht geschrieben habe, daher werde ich es nur kurz anreißen. Ist ein Molekül geladen, ist es dadurch automatisch sehr viel weniger lipophil und kann Membranen deutlich schlechter überwinden. Wenn im selben Molekül aber eine positive und eine negative Ladung vorkommen – so wie bei Tetrazyklin bei physiologischem pH – gleichen diese sich aus. Dadurch ist das Molekül in Summe wieder ungeladen und kann durch die Membran gelangen.

Stoffe im drug-like space

Sind solche Moleküle also die Ausnahme, die die Regel bestätigen? Nicht ganz. Denn tatsächlich hätte die Rule of Five eine ordentliche Generalüberholung nötig. Auch wenn sie Pionierarbeit geleistet hat, physikochemische und klinische Eigenschaften von Arzneistoffen miteinander zu verknüpfen, könnte das strikte Beharren auf diese Regeln in Zukunft eher schaden als nutzen.

Michael D. Schultz hat in einem Artikel von 2018 einen genauen Blick auf das Vermächtnis der Rule of Five geworfen. Denn die Regeln wurden mit Blick auf die Arzneistoffe vor 1997 aufgestellt. Schultz schreibt:

 „A property that is truly related to the probability of achieving solubility and oral exposure must be static and not change faster than the evolution of the organism to which it is targeted. Any rule based on a time-dependent value cannot predict the future […].”

Und wenn man die Eigenschaften der Arzneistoffe betrachtet, die seit 1998 von der FDA – der US-amerikanischen Arzneimittelbehörde – zugelassen wurden, dann fallen tatsächlich einige Abweichungen von der Rule of Five auf.

Außer der Zahl an Wasserstoffbrücken-Donatoren haben sich alle anderen Eigenschaften im Vergleich zu der Zeit vor 1997 statistisch signifikant verändert. Besonders dramatisch ist diese Veränderung bei der Molekülmasse. Seit 1998 wurden deutlich mehr Arzneistoffe zugelassen als in dem gleichen Zeitraum zuvor, und dieser Anstieg ist zu einem großen Teil auf Arzneistoffe mit einer relativen Molekülmasse über 500 zurückzuführen. 2016 und 2017 war die durchschnittliche Molekülmasse der zugelassenen Arzneistoffe sogar größer als 500, der Grenze der Rule of Five.

Von der FDA zugelassene Arzneistoffe nach Zeitraum. Stoffe mit einer Molekülmasse unter 500 sind blau und über 500 sind rot (Bild: Schultz, 2018, 10.1021/acs.jmedchem.8b00686

Die Rule of Five, und besonders der Grenzwert für die Molekülmasse, konnte also die zukünftige Entwicklung von Arzneistoffen nicht vorhersagen.

Welche Konsequenzen könnte das haben? Nun, dafür müssen wir kurz über den drug-like space sprechen. Stellt euch einen Raum vor, der angefüllt ist mit allen möglichen Molekülen, die existieren können. Um neue (oral anwendbare) Arzneistoffe zu finden, muss dieser Raum, der chemical space abgesucht werden. Der chemical space ist aber viel zu groß, deshalb muss die Auswahl irgendwie eingeengt werden, auf Moleküle, die mit einer einigermaßen hohen Wahrscheinlichkeit oral bioverfügbar sein könnten. Das kann man dann als drug-like space bezeichnen (tatsächlich steht aber Schultz beispielsweise dem Begriff drug-like eher skeptisch gegenüber).

Wenn jetzt die Rule of Five maßgeblich ist um festzustellen, welche Stoffe in diesem drug-like space liegen, und die Rule of Five diese Eigenschaft aber zumindest nicht zuverlässig vorhersagen kann, dann bleiben möglicherweise viele potentielle Arzneistoffe unbeachtet. Gerade in einer Zeit, in der auch viele neue Arten von Arzneistoffen in den Vordergrund rücken, könnte es daher eher schädlich sein, zu sehr auf die Rule of Five zu beharren.

Wenn euch dieser Text gefallen hat, dann abonniert doch gerne meinen Email-Newsletter, um keine neuen Blogbeiträge mehr zu verpassen. Und wenn ihr tiefer in das Thema Rule of Five einsteigen wollt, dann lest doch am besten das verlinkte Paper von Michael Schultz.

© 2024 PharmBlog

Theme by Anders NorenUp ↑

WordPress Cookie Notice by Real Cookie Banner