GEISST - Generator für emotional individualisierbare Synthetik-Stimmen

Jonas, Marc; Nowacki, Filip; Ahmed, Khawar; Danilov, Vladyslav

doi:https://doi.org/10.34657/34698

GEISST - Generator für emotional individualisierbare Synthetik-Stimmen

Files

Teil1-Kurzbericht_GEISST_nachtblau.pdf (44.62 KB)

Teil2-Schlussbericht_GEISST_nachtblau.pdf (862.37 KB)

Date

2026-04-27

Authors

Publisher

Hannover : Technische Informationsbibliothek

Abstract

Im Projekt GEISST wurde eine KI-gestützte Lösung zur Generierung emotional individualisierbarer synthetischer Stimmen entwickelt. Ziel war es, Sprachsynthese um eine flexible und kontextabhängige Steuerung emotionaler Ausprägungen zu erweitern.

Als Anwendungsfall wurde der „Smart Publisher“-Workflow konzipiert, der die automatisierte Erstellung audiovisueller Beitragsvarianten ermöglicht. Hierzu wurden Verfahren zur Transkription, KI-basierten Inhaltskondensation sowie zur synthetischen Vertonung entwickelt und in einem Demonstrator integriert.

Der Demonstrator bildet eine durchgängige Verarbeitungskette ab, die von der Analyse von Videoinhalten über die Generierung von Text und Voiceover bis hin zur automatisierten Szenenauswahl und Formatanpassung reicht. Die Ergebnisse zeigen ein erhebliches Potenzial zur Effizienzsteigerung in der Medienproduktion, insbesondere im Broadcast-Umfeld. Für eine produktive Nutzung sind jedoch weitere Entwicklungen hinsichtlich Performance und Systemintegration erforderlich.

Keywords

KI, Synthetikstimme, Künstliche Intelligenz, Medienworkflows, Sprachsynthese, Text-to-Speech, Emotionale Sprachgenerierung, Medienproduktion, Broadcast, Content-Automatisierung, Videoverarbeitung, Media Asset Management

Conference

01.04.2023-30.11.2025

Publication Type

Report

Version

publishedVersion

URI

https://oa.tib.eu/renate/handle/123456789/35630
https://doi.org/10.34657/34698

Collections

Forschungsberichte Pflichtabgabe (BMFTR, BMWE…)

License

Creative Commons Attribution-NonDerivs 3.0 Germany

Full item page

GEISST - Generator für emotional individualisierbare Synthetik-Stimmen

Files

Date

Authors

Editor

Advisor

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Supplementary Material

Other Versions

Link to publishers' Version

Abstract

Description

Keywords

Keywords GND

Conference

Publication Type

Version

URI

Collections

License