GEISST - Generator für emotional individualisierbare Synthetik-Stimmen

Loading...
Thumbnail Image

Editor

Advisor

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek

Supplementary Material

Other Versions

Link to publishers' Version

Abstract

Im Projekt GEISST wurde eine KI-gestützte Lösung zur Generierung emotional individualisierbarer synthetischer Stimmen entwickelt. Ziel war es, Sprachsynthese um eine flexible und kontextabhängige Steuerung emotionaler Ausprägungen zu erweitern.

Als Anwendungsfall wurde der „Smart Publisher“-Workflow konzipiert, der die automatisierte Erstellung audiovisueller Beitragsvarianten ermöglicht. Hierzu wurden Verfahren zur Transkription, KI-basierten Inhaltskondensation sowie zur synthetischen Vertonung entwickelt und in einem Demonstrator integriert.

Der Demonstrator bildet eine durchgängige Verarbeitungskette ab, die von der Analyse von Videoinhalten über die Generierung von Text und Voiceover bis hin zur automatisierten Szenenauswahl und Formatanpassung reicht. Die Ergebnisse zeigen ein erhebliches Potenzial zur Effizienzsteigerung in der Medienproduktion, insbesondere im Broadcast-Umfeld. Für eine produktive Nutzung sind jedoch weitere Entwicklungen hinsichtlich Performance und Systemintegration erforderlich.

Description

Keywords GND

Conference

01.04.2023-30.11.2025

Publication Type

Report

Version

publishedVersion

License

Creative Commons Attribution-NonDerivs 3.0 Germany