OTC-Genomics

Sperlea, Theodor; Labrenz, Matthias

doi:https://doi.org/10.34657/21913

OTC-Genomics

Abschlussbericht Zukunftscluster OTC Rostock

Files

Abschlussbericht_TIB.pdf (1.56 MB)

Date

2025-09-16

Authors

Sperlea, Theodor

Labrenz, Matthias

Publisher

Hannover : Technische Informationsbibliothek

Supplementary Material

https://identifiers.org/ena.embl:PRJEB88008
https://identifiers.org/ena.embl:PRJEB88011
https://doi.org/10.12754/data-2025-0005
https://doi.org/10.12754/data-2025-0001

Abstract

Eine zentrale These der Ökologie besteht darin, dass die Zusammensetzung der biotischen Gemeinschaft durch Eigenschaften der Umwelt selektiert wird. Dadurch kann durch die Erfassung der Abundanz bestimmter Organismen auf andere Aspekte des Ökosystems geschlossen werden. Durch Methoden wie das Amplikon-Sequenzieren kann nun ein Großteil der Zusammensetzung der biotischen Gemeinschaft im Hochdurchsatzverfahren erfasst werden, was die Identifikation vieler neuer Bioindikatoren verspricht. Die Anzahl der erfassten Taxa ist allerdings häufig fünfstellig. Somit sind die gewonnenen Daten Hochdimensional und schwer mit eher klassischen statistischen Methoden zu analysieren bzw. zu interpretieren. Methoden des Maschinellen Lernens sind allerdings optimal für die Analyse ausgerichtet und erlauben die Identifizierung von Bioindikatoren. Dazu sollten die Datensätze allerdings harmonisiert und vergleichbar generiert worden sein. Die Ziele des Vorhabens sind daher (1) die Entwicklung einer reproduzierbaren und semi-autonomen Bearbeitungspipeline und (2) die Beantwortung der Frage, ob die Analyse von mikrobiellen Daten mittels verschiedener Machine-Learning-Methoden aktuelle Schadstoffbelastungen in der aquatischen Umwelt ableiten kann. Ein grundlegendes Ergebnis des Vorhabens ist die Generierung eines Datensatzes, der die Dynamik der biotischen Gemeinschaft sowie von verschiedenen anthropogenen Spurenstoffen entlang des Warnow-Ästuars in hoher räumlicher und zeitlicher Auflösung über ein volles Jahr umfasst. Dieser Datensatz ist in seiner Qualität weltweit einzigartig und von hohem Wert für die Forschung. So ermöglichte uns der Datensatz eine Aufklärung der Phänologie von pathogenen und nicht-pathogenen Vibrionen an der Ostseeküste, sowie eine Überprüfung von Identifikationsmethoden dieser Organismengruppe sowie die Präsentation eines ersten Vorhersagemodells für Vibrionenblüten. Die erhobenen Konzentrationen der anthropogenen Spurenstoffe deutet darauf hin, dass die biotischen Gemeinschaften in Ästuaren ganzjährig gleichzeitig mehreren Stoffen in grenzwertüberschreitenden Konzentrationen ausgesetzt sind. Mit dem im Projektverlauf angestellten Benchmark-Methodenvergleich konnte im Projekt nun auch Klarheit über die optimale Methodenwahl im Maschinellen Lernen mit mikrobiellen eDNA-Datensätzen geschaffen werden. Schließlich können wir belegen, dass eine Approximation der Chemiedaten auf der Basis von eDNA-Daten funktioniert. Auf dem Weg dahin wurden best practices für die Datenerhebung und das Datenmanagement gesammelt, die semiautonome Bearbeitungspipelines und projektinterne Datenbanken umfassen.

Keywords

molekulare Umweltüberwachung, Umweltüberwachung, DNA, Künstliche Intelligenz, machine learning

Publication Type

Report

Version

publishedVersion

URI

https://oa.tib.eu/renate/handle/123456789/22896
https://doi.org/10.34657/21913

Collections

Forschungsberichte Pflichtabgabe (BMFTR, BMWE…)

License

Creative Commons Attribution-NonDerivs 3.0 Germany

https://creativecommons.org/licenses/by-nd/3.0/de/

Full item page

OTC-Genomics

Files

Date

Authors

Editor

Advisor

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Supplementary Material

Other Versions

Link to publishers' Version

Abstract

Description

Keywords

Keywords GND

Conference

Publication Type

Version

URI

Collections

License