SSTDBB: Sprechen Sie Toxin? Die Botschaft der Bakteriophagen; Teilvorhaben Übersetzung

Loading...
Thumbnail Image

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek
München : oekom verlag

Link to publishers version

Abstract

Im Teilvorhaben „Übersetzung“ des Projekts SSTDBB: Sprechen Sie Toxin? Die Botschaft der Bakteriophagen (Förderkennzeichen 16DKWN136B; Laufzeit 01.09.2022–31.08.2025) wurde ein datengetriebener Ansatz entwickelt, um aus Proteinsequenzen Hinweise auf potenziell toxische Eigenschaften abzuleiten. Motivation war, neue bakterielle Exotoxine effizienter zu identifizieren und zugleich Bakteriophagen im Kontext der Phagentherapie frühzeitig auf mögliche Toxinrisiken zu screenen. Methodisch wurde eine kuratierte, auf bakterielle Exotoxine fokussierte Datengrundlage aufgebaut (ohne tierische Toxine), und Protein-Language-Model-Repräsentationen (pLM-Embeddings) wurden für Modellierung und Priorisierung genutzt. Ein zunächst überwachtes Klassifikationsmodell zeigte zwar starke interne Kennzahlen, erwies sich jedoch bei Anwendung auf Phagenproteine als zu unspezifisch (Generalisierungs-/Domain-Shift-Problem). Daraufhin wurde die Strategie auf einen distanzbasierten, unüberwachten Ansatz erweitert, der mehrere Proteinrepräsentationen (inkl. Struktur-/Fold-Informationen) kombiniert und Kandidaten über Ähnlichkeiten zu Referenztoxinen priorisiert.

Parallel wurde eine experimentelle Pipeline etabliert (Klonierung/Expression/Proteinproduktion) und 20 priorisierte Kandidaten (als 24 rekombinante Konstrukte) wurden in zwei Modellsystemen getestet (u. a. Tetrahymena thermophila und HEK293-Zellen; metabolismusbasierte Readouts). Unter den geprüften Bedingungen ergab sich bislang keine eindeutige toxische Wirkung; als methodische Erweiterung wird eine intrazelluläre Expression in HEK293-Zellen nach Projektende weitergeführt, um potenziell zellinterne Wirkmechanismen besser abzubilden. Über die wissenschaftlichen Ergebnisse hinaus wurden reproduzierbare, FAIR- und Open-Science-orientierte Workflows (Daten-/Code-Releases, Protokolle) aufgebaut und umfangreich in Ausbildung und Lehre transferiert (Nachwuchsförderung, wiederkehrende Data-Literacy-Formate). Insgesamt liefert das Vorhaben sowohl methodische „Lessons Learned“ für robuste Toxinvorhersage in realen Anwendungsräumen als auch eine nachhaltige Struktur zur Verankerung datenbasierter Toxikologie an der Schnittstelle von Bioinformatik und Experiment.

Description

Keywords

License

CC BY-NC 3.0 DE