GEISST - Generator für emotional individualisierbare Synthetik-Stimmen
Date
Editor
Advisor
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Supplementary Material
Other Versions
Link to publishers' Version
Abstract
Im Projekt GEISST wurde eine KI-gestützte Lösung zur Generierung emotional individualisierbarer synthetischer Stimmen entwickelt. Ziel war es, Sprachsynthese um eine flexible und kontextabhängige Steuerung emotionaler Ausprägungen zu erweitern.
Als Anwendungsfall wurde der „Smart Publisher“-Workflow konzipiert, der die automatisierte Erstellung audiovisueller Beitragsvarianten ermöglicht. Hierzu wurden Verfahren zur Transkription, KI-basierten Inhaltskondensation sowie zur synthetischen Vertonung entwickelt und in einem Demonstrator integriert.
Der Demonstrator bildet eine durchgängige Verarbeitungskette ab, die von der Analyse von Videoinhalten über die Generierung von Text und Voiceover bis hin zur automatisierten Szenenauswahl und Formatanpassung reicht. Die Ergebnisse zeigen ein erhebliches Potenzial zur Effizienzsteigerung in der Medienproduktion, insbesondere im Broadcast-Umfeld. Für eine produktive Nutzung sind jedoch weitere Entwicklungen hinsichtlich Performance und Systemintegration erforderlich.
