Künstliche Intelligenz revolutioniert unser Verständnis der genetischen Regulierung in Pflanzen**

Künstliche Intelligenz revolutioniert unser Verständnis der genetischen Regulierung in Pflanzen**

Ein internationales Team von Wissenschaftlern, angeführt vom Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung (IPK) sowie dem Forschungszentrum Jülich, hat mithilfe von künstlicher Intelligenz (KI) ein wegweisendes Modell entwickelt, das aufzeigt, wo regulatorische Proteine an die DNA von Pflanzen andocken, um Gene zu aktivieren oder zu deaktivieren. Dieses innovative Modell wurde mit umfassenden Genomdaten der Modellpflanze Arabidopsis thaliana trainiert und kann auch auf wirtschaftlich bedeutende Pflanzenarten angewendet werden. Die Forschungsergebnisse liefern tiefere Einblicke in die genetischen Variationen, die die Leistungsfähigkeit von Nutzpflanzen beeinflussen, und wurden im renommierten Fachjournal „Nature Communications“ veröffentlicht.

Wenn wir über das Erbgut von Organismen sprechen, denken viele Menschen zunächst an Gene. Doch Gene allein sind nicht ausreichend, um die unterschiedlichen Wachstums- und Reaktionsmuster von Pflanzen auf Umweltfaktoren zu erklären. Die DNA enthält zudem viele Abschnitte, die als Schalter oder Regler fungieren. Zu den bedeutendsten regulatorischen Elementen gehören Transkriptionsfaktoren, die an die DNA binden und bestimmen, wann und wie stark ein Gen exprimiert wird. Die Aktivierung eines Gens erfolgt über komplexe Mechanismen, die es ermöglichen, genetische Informationen in RNA oder Proteine umzuwandeln, die dann physiologische Funktionen übernehmen. Man kann sich dies wie ein Haus vorstellen: Die Gene sind die Räume, während die regulatorischen Elemente als Lichtschalter und Thermostate fungieren, die den Betrieb des Hauses steuern.

Die Forscher des IPK wollten die zugrundeliegenden Mechanismen dieser Regulation besser verstehen, indem sie ein tiefes Lernmodell entwickelten, das auf einer Vielzahl experimenteller DNA-Bindungsdaten basierte. Dieses Modell wurde trainiert, um die Bindungsmuster von insgesamt 46 verschiedenen Familien von Transkriptionsfaktoren gleichzeitig zu erkennen. Im Gegensatz zu früheren Ansätzen, bei denen für jeden einzelnen Transkriptionsfaktor ein eigenes Modell erstellt werden musste, ermöglicht der neue „Multi-Label“-Ansatz eine umfassendere Analyse des gesamten Genoms.

Das Forschungsteam testete anschließend, ob das Modell in der Lage war, Bindungsstellen präzise zu lokalisieren und neue regulatorische Zusammenhänge aufzudecken. Die Ergebnisse zeigten, dass Transkriptionsfaktoren nicht isoliert arbeiten, sondern dass der Kontext und die Beziehungen zwischen den Signalen entscheidend sind. Dies ist vergleichbar mit einem Text, bei dem die Bedeutung nicht nur durch die individuellen Wörter, sondern auch durch deren Anordnung und Zusammenhang entsteht.

Zusätzlich analysierte die KI die Bindungsmuster der Transkriptionsfaktoren und kategorisierte die Gene in verschiedene Gruppen. Dabei stellte sich heraus, dass Tausende von Genen in lediglich 14 große regulatorische Cluster eingeordnet werden können. Viele dieser Cluster korrelieren miteinander und weisen gemeinsame biologische Funktionen auf. Trotz der enormen Anzahl an Genen in Pflanzen zeigt sich, dass viele ihrer Funktionen aus einer relativ kleinen Anzahl an regulatorischen Mustern resultieren.

Das Team untersuchte auch über 7.000 DNA-Varianten, die in genomweiten Studien mit Merkmalen wie Blütezeit, Krankheitsresistenz und Keimlingswachstum in Verbindung gebracht wurden. Bei etwa 20 Prozent dieser Varianten konnte eine Veränderung in der Bindung von Transkriptionsfaktoren vorhergesagt werden. Dies ermöglicht es den Wissenschaftlern, abzuschätzen, wie spezifische Veränderungen in regulatorischen DNA-Abschnitten die Genaktivität und damit wichtige Merkmale von Pflanzen beeinflussen.

Ein besonders aufschlussreiches Beispiel war die Vorhersage zur Blühzeit. Die KI identifizierte, dass eine einzelne regulatorische Veränderung die Bindung mehrerer Transkriptionsfaktoren beeinflussen könnte. Solche Veränderungen sind entscheidend dafür, dass Pflanzen früher oder später blühen. Die Vorhersagen des Modells wurden anschließend experimentell überprüft und bestätigt.

Obwohl das Modell auf Daten der Modellpflanze Arabidopsis trainiert wurde, konnte es auch erfolgreich auf Mais angewendet werden, wo es half, Transkriptionsfaktoren zu identifizieren, die auf Hitzestress reagieren. Diese Ergebnisse zeigen das enorme Potenzial des KI-gestützten Ansatzes für die Pflanzenforschung und seine Anwendbarkeit auf Arten, für die bisher weniger molekulare Bindungsdaten vorlagen.

Mit diesen Fortschritten eröffnet sich eine neue Ära in der Pflanzenforschung, die es ermöglicht, die komplexen Zusammenhänge zwischen Genetik, Umwelt und Pflanzenentwicklung besser zu verstehen und gezielte Züchtungsmaßnahmen zur Verbesserung von Nutzpflanzen zu entwickeln.