OTC-Genomics
Date
Authors
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Eine zentrale These der Ökologie besteht darin, dass die Zusammensetzung der biotischen Gemeinschaft durch Eigenschaften der Umwelt selektiert wird. Dadurch kann durch die Erfassung der Abundanz bestimmter Organismen auf andere Aspekte des Ökosystems geschlossen werden. Durch Methoden wie das Amplikon-Sequenzieren kann nun ein Großteil der Zusammensetzung der biotischen Gemeinschaft im Hochdurchsatzverfahren erfasst werden, was die Identifikation vieler neuer Bioindikatoren verspricht. Die Anzahl der erfassten Taxa ist allerdings häufig fünfstellig. Somit sind die gewonnenen Daten Hochdimensional und schwer mit eher klassischen statistischen Methoden zu analysieren bzw. zu interpretieren. Methoden des Maschinellen Lernens sind allerdings optimal für die Analyse ausgerichtet und erlauben die Identifizierung von Bioindikatoren. Dazu sollten die Datensätze allerdings harmonisiert und vergleichbar generiert worden sein. Die Ziele des Vorhabens sind daher (1) die Entwicklung einer reproduzierbaren und semi-autonomen Bearbeitungspipeline und (2) die Beantwortung der Frage, ob die Analyse von mikrobiellen Daten mittels verschiedener Machine-Learning-Methoden aktuelle Schadstoffbelastungen in der aquatischen Umwelt ableiten kann. Ein grundlegendes Ergebnis des Vorhabens ist die Generierung eines Datensatzes, der die Dynamik der biotischen Gemeinschaft sowie von verschiedenen anthropogenen Spurenstoffen entlang des Warnow-Ästuars in hoher räumlicher und zeitlicher Auflösung über ein volles Jahr umfasst. Dieser Datensatz ist in seiner Qualität weltweit einzigartig und von hohem Wert für die Forschung. So ermöglichte uns der Datensatz eine Aufklärung der Phänologie von pathogenen und nicht-pathogenen Vibrionen an der Ostseeküste, sowie eine Überprüfung von Identifikationsmethoden dieser Organismengruppe sowie die Präsentation eines ersten Vorhersagemodells für Vibrionenblüten. Die erhobenen Konzentrationen der anthropogenen Spurenstoffe deutet darauf hin, dass die biotischen Gemeinschaften in Ästuaren ganzjährig gleichzeitig mehreren Stoffen in grenzwertüberschreitenden Konzentrationen ausgesetzt sind. Mit dem im Projektverlauf angestellten Benchmark-Methodenvergleich konnte im Projekt nun auch Klarheit über die optimale Methodenwahl im Maschinellen Lernen mit mikrobiellen eDNA-Datensätzen geschaffen werden. Schließlich können wir belegen, dass eine Approximation der Chemiedaten auf der Basis von eDNA-Daten funktioniert. Auf dem Weg dahin wurden best practices für die Datenerhebung und das Datenmanagement gesammelt, die semiautonome Bearbeitungspipelines und projektinterne Datenbanken umfassen.
