Inhaltspezifische Aktionen

Abstract Kevin Rockenbach

Mehrzellige Organismen, wie Tiere und Pflanzen, zeichnen sich dadurch aus, dass einzelne Zellen oder Zellverbände sich auf bestimmte Aufgaben spezialisieren können. Dies ermöglicht die Bildung von spezialisierten Geweben und Organen, die dem Erhalt oder der Vermehrung des Organismus als Ganzem dienen. Dennoch besitzen alle Zellen eines Organismus in der Regel denselben Informationsgehalt auf Ebene der DNA, dem Hauptinformationsträger in allen Lebewesen auf diesem Planeten. Der Unterschied zwischen Zellen aus unterschiedlichen Geweben besteht darin welche Gene abgelesen werden und wie häufig sie abgelesen werden. Gene werden abgelesen, indem RNA-Kopien von ihnen hergestellt werden, welche den Zellkern verlassen und in Proteine übersetzt werden können. Während der Informationsfluss bei der Übersetzung von Gensequenzen in Proteine sehr gut erforscht ist, wissen wir vergleichsweise wenig darüber, wo und wie genau die Information gespeichert ist, welche die Zellen eines Gewebes wissen lässt, welche Proteine sie für ihre jeweiligen Aufgaben benötigen und in welcher Menge. Die Codierung dieser Information ist deutlich komplexer und dezentraler als jene in Protein-codierenden Sequenzen.

So genannte „Machine Learning“ Algorithmen sind in der Lage anhand einer großen Anzahl an Beispielen subtile Muster zu erkennen, welche ein Eingangssignal mit einem zugehörigen Ausgangssignal verknüpfen. Auf diese Weise können Vorhersagemodelle erstellt werden, mit denen das Ausgangssignal anhand des Eingangssignals vorhergesagt werden kann. 

In seiner Masterarbeit “Tissue-Specific Prediction of mRNA Abundance from Genomic Sequence in Brassica napus L. using Convolutional Neural Networks” von Kevin Rockenbach wurden DNA-Sequenzabschnitte um den Startpunkt von Rapsgenen herum verwendet, um vorherzusagen, in welchem von vier verschiedenen Geweben die meisten RNA-Kopien des jeweiligen Gens vorliegen, sowie die zugehörige Anzahl an Kopien in diesem Gewebe.

Anhand der Vorhersagegenauigkeit des Models lässt sich schlussfolgern, dass in Raps mehr als 40% der Information, welche das gewebespezifische Ablesen von Genen steuert, in unmittelbarer Nähe zum jeweiligen Gen, auf DNA-Ebene codiert ist. Dieses Wissen kann dabei helfen die zugrundliegenden Mechanismen genauer zu untersuchen.

Betreuer waren Dr. Agnieszka Golicz und Prof. Dr. Rod Snowdon, Professur für Pflanzenzüchtung.