DAKODA: Datenkompetenzen in DaF/DaZ: Exploration sprachtechnologischer Ansätze zur Analyse von L2-Erwerbsstufen in Lernerkorpora des Deutschen
Date
Authors
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Das Verbundprojekt DAKODA hatte das Ziel, die bislang heterogene und nur eingeschränkt nachnutzbare Datenlage zum Erwerb des Deutschen als Zweit- und Fremdsprache (DaZ/DaF) grundlegend zu verbessern. Ausgangspunkt war, dass zwar zahlreiche Lernerkorpora vorlagen, diese aber in unterschiedlichen Formaten, mit uneinheitlichen Metadaten und ohne gemeinsame technische Grundlage verfügbar waren. Korpusübergreifende Analysen, Replikationen und großangelegte empirische Untersuchungen waren kaum möglich. Vor diesem Hintergrund sollte DAKODA erstens bestehende Lernerkorpora technisch konsolidieren und in einer wissenschaftlich nutzbaren Ressource zusammenführen. Zweitens sollten automatische Verfahren zur Annotation von L2-Erwerbsstufen, insbesondere im Bereich der Verbstellung, entwickelt und validiert werden. Drittens zielte das Projekt auf den Aufbau und die Verbreitung von Datenkompetenzen im Fach DaZ/DaF sowie auf die Bereitstellung der Ergebnisse und infrastrukturellen Ressourcen für die Fachcommunity ab. Theoretisch knüpfte das Projekt vor allem an die Processability Theory an, die den L2-Erwerb mit Hilfe von implikationellen Erwerbsstufen beschreibt. Für das Deutsche wurden diese bislang vor allem über Verbstellungstypen wie kanonische Wortstellung, Adverb-Voranstellung, Verbseparation, Inversion und Verbendstellung im Nebensatz operationalisiert. Die bisherige Forschung stützt grundsätzlich einen gestuften Erwerb, beruhte jedoch häufig auf kleinen Stichproben, nicht-öffentlichen Daten und zumeist manuellen Analysen. Aspekte wie Variation innerhalb der Stufen und (sprachliche) Kontextabhängigkeit der Strukturen blieben oft ausgeklammert. Hier setzte DAKODA an, indem es die Stufen differenzierter und variationssensibler operationalisierte und darauf aufbauend automatisierte Zugänge erprobte.
