Verbundprojekt: "VoluProf: Photo und Audiorealistische*r Volumetrische*r Mixed Reality Professor*in für omnipräsente und nutzeroptimierte Lehre"; Teilprojekt: "Sprachsynthese zur Avatarvertonung und Spracherkennung zur Nutzer*inneninteraktion" - Förderprogramm: "VR/AR: digitale Gesellschaft"

Benjamin, Körner

doi:https://doi.org/10.34657/20491

Verbundprojekt: "VoluProf: Photo und Audiorealistischer Volumetrischer Mixed Reality Professorin für omnipräsente und nutzeroptimierte Lehre"; Teilprojekt: "Sprachsynthese zur Avatarvertonung und Spracherkennung zur Nutzerinneninteraktion" - Förderprogramm: "VR/AR: digitale Gesellschaft"

Schlussbericht zum Verwendungsnachweis

dc.contributor.author	Benjamin, Körner
dc.date.accessioned	2025-08-21T08:32:54Z
dc.date.available	2025-08-21T08:32:54Z
dc.date.issued	2025-08-20
dc.description.abstract	Ziel war die realistische Stimme des Avatars aus einem von dem/r Lehrenden bereitgestellten Text zu generieren. Dies sollte mit möglichst wenig Daten dieser Person machbar sein, sodass auf umfangreiche Sprachaufnahmen im Tonstudio verzichtet werden kann. Weiterhin war geplant zu untersuchen, inwiefern Sprachaufnahmen aus bisherigen Quellen hierzu genutzt werden können, z.B. aus schon aufgezeichneten Vorlesungen oder Vorträgen. Basierend auf einem maschinell trainierten Grundmodell der deutschen Sprache und den sprachlichen Merkmalen, welche anhand einzelner Aufnahmen extrahiert werden, sollte dazu aus textuellem Input “live” oder „offline” die Stimme für den Avatar synthetisiert werden. Für die Lippensynchronität des animierten Avatars war angedacht Ausspracheinformationen für den Inhalt der Vorlesung bereitzustellen werden. Diese könnten genutzt werden, um die Lippenbewegung an die tatsächlich gesprochenen Laute anzupassen. Das im Projekt entwickelte System sollte weiterhin hinsichtlich der Qualität der technischen Nutzer*innenerfahrung optimiert und evaluiert werden. Dazu sollten psychophysikalische Testverfahren für die Qualitätsbeurteilung von MR-Umgebungen entworfen und validiert werden. Auf Basis der entwickelten Testverfahren war geplant konstituierende Aspekte wahrgenommener Qualität in MR (etwa visueller Detailgrad, räumliches Audio, VR-Krankheit oder Immersionserfahrung) zu identifizieren. Der Einfluss und die Interaktion der Systemparameter (etwa Latenz, Kanalbreite oder Betrachtungsabstand) auf die wahrgenommene Qualität sollte zudem quantifiziert und zur Systemoptimierung genutzt werden. Die in kontinuierlichen Tests gewonnenen Daten qualitätsannotiertes Videomaterial) sollten dazu genutzt werden, um modell- und datengetriebene Methoden zur automatischen Qualitätsschätzung zu entwickeln. Des Weiteren sollte auch die Authentizität der generierten Stimme des Avatars durch subjektive Testverfahren untersucht werden.	ger
dc.description.version	publishedVersion
dc.identifier.uri	https://oa.tib.eu/renate/handle/123456789/21474
dc.identifier.uri	https://doi.org/10.34657/20491
dc.language.iso	ger
dc.publisher	Hannover : Technische Informationsbibliothek
dc.relation.affiliation	Aristech GmbH
dc.rights.license	Creative Commons Attribution-NonDerivs 3.0 Germany
dc.rights.uri	https://creativecommons.org/licenses/by-nd/3.0/de/
dc.subject.ddc	600
dc.title	Verbundprojekt: "VoluProf: Photo und Audiorealistischer Volumetrischer Mixed Reality Professorin für omnipräsente und nutzeroptimierte Lehre"; Teilprojekt: "Sprachsynthese zur Avatarvertonung und Spracherkennung zur Nutzerinneninteraktion" - Förderprogramm: "VR/AR: digitale Gesellschaft"	ger
dc.title.subtitle	Schlussbericht zum Verwendungsnachweis
dc.type	Report
dcterms.extent	17 Seiten
dtf.duration	01.09.2021-28.02.2025
dtf.funding.funder	BMFTR
dtf.funding.program	16SV8708
dtf.funding.verbundnummer	01235276
tib.accessRights	openAccess

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Schlussbericht_VoluProf_16SV8708.pdf
Size:: 197.7 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Forschungsberichte Pflichtabgabe (BMFTR, BMWE…)