iDOKS: Entwicklung eines integrierten Dokumentations-Systems für die automatisierte Informationsverdichtung von Multi-Sprecher-Szenarien durch neue Methoden der künstlichen Sprach-Intelligenz

Loading...
Thumbnail Image

Date

Authors

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek

Link to publishers version

Abstract

Gegenstand des Projekts iDOKS war die Entwicklung eines Dokumentations-Systems für die automatisierte Informationsverdichtung, speziell in Multi-Sprecher-Szenarien. Audioaufnahmen aus solchen Szenarien (insb. Redebeiträge im Plenum der Landeshauptstadt Dresden) werden dabei zuerst verschriftet, die Redebeiträge einzelner Sprecher getrennt (Sprechertrennung), ggf. Sprecher erkannt (Sprecheridentifikation) und aus der Transkription die wichtigsten Informationen extrahiert und zusammengefasst. Die zentralen Forschungs- und Entwicklungsbereiche des Projektes waren

  1. die Verbesserung der Spracherkennung für Multi-Sprecher-Szenarien,
  2. die Verdichtung (Summarization) von Transkripten und
  3. die Entwicklung einer Applikation, d.h. eines intelligenten, Domänen-unabhängigen Dokumentations-Systems (iDOKS).

Die Interpretation komplexer Gespräche ist von einer genauen Spracherkennung sowie Sprechertrennung und -identifikation abhängig. Die Erkennung von Spontansprache in Gesprächen ist oft noch problematisch für herkömmliche Sprachmodelle. Vor allem aber in Szenarien, in denen Raummikrofone verwendet werden, wie sie bspw. in Besprechungs- und Konferenzräumen verwendet werden, stellen die Entfernungen zum Mikrofon und Störungen wie Hintergrundgeräusche und Raumhall nach wie vor Herausforderungen für eine robuste und verlässliche Erkennung dar.

Im Teilvorhaben der Linguwerk GmbH wurden dabei die für das Gesamtsystem notwendigen Module (1) Multi-Sprecher-Identifikation und (2) Raummikrofon-Spracherkennung erforscht und entwickelt.

Datei-Upload durch TIB

Description

Keywords

License

Creative Commons Attribution-NonDerivs 3.0 Germany