KI Data Tooling - Methoden und Werkzeuge für das Generieren und Veredeln von Trainings-, Validierungs- und Absicherungsdaten für KI-Funktionen autonomer Fahrzeuge
Date
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Die Verwendung von Algorithmen, welche Methoden der künstlichen Intelligenz einsetzen, wird aktuell als einer der Schlüsselfaktoren gesehen, um automatisierte Fahrfunktionen effizient umzusetzen. Trainings-, Validierungs- und vor allem Testdaten sind für die Entwicklung und die Absicherung von solchen KI-Systemen im automobilen Umfeld essentiell. Da KI-Systeme umfassend trainiert und validiert werden müssen, kann das Vorliegen einer geeigneten Datenbasis erheblich dazu beitragen, Entwicklungszyklen zu verkürzen. KI Data Tooling adressiert diese Notwendigkeit erstmals systematisch und umfassend. Hierbei funktioniert KI Data Tooling als ein Baustein der KI Projektfamilie innerhalb der VDA Leitinitiative autonomes und vernetztes Fahren (VDA-LI). Im Rahmen der VDA-LI wurden offene Fragestellungen bei der Umsetzung automatisierter Fahrfunktionen identifiziert und in Projekte und Projektfamilien gruppiert. Als Teil der KI Projektfamilie, welche Fragestellungen rund um den Einsatz von künstlicher Intelligenz für automatisierte Fahrfunktionen bearbeitet, wird KI Data Tooling im engen Austausch mit den anderen Projekten stehen, um Anforderungen, erhobene Daten und entwickelte Methoden auszutauschen. KI Data Tooling entwickelt Methoden und Tools, die eine Beschreibung, Verarbeitung, Selektion, Generierung, Komprimierung und Bereitstellung oder Übertragung von Daten, wie beispielsweise Einzelbildern oder Sequenzen von unterschiedlichen Kamera-, Radar- oder Lidar-Sensoreindrücken von relevanten Szenarien, ermöglichen. Ziel ist es, eine Datenbasis für das Training, die Validierung sowie für Test und Absicherung von KI-Systemen herzustellen. Dabei werden Lösungen erzeugt, die es ermöglichen, effizient und systematisch Daten unterschiedlicher Güte, unterschiedlichen Ursprungs (synthetisch erzeugt oder auf Basis von Realdaten), unterschiedlicher Sensorsetups oder -technologien zu nutzen und weiter zu verwerten. Um die Methoden und Tools zu verifizieren, werden sie am Beispiel des Use Cases Fußgängererkennung verwendet und optimiert. Dieser Use Case ermöglicht die direkte Beurteilung der Methoden und Tools anhand konkreter Anforderungen an die entstehenden Daten und er ist zentral für den erfolgreichen Einsatz automatisierter Fahrfunktionen. Darüber hinaus profitiert das Training von Fußgängererkennungsalgorithmen von der Einbeziehung synthetischer Daten, da diese erlauben, auch gefährliche Grenzsituationen systematisch abzubilden. Schließlich ermöglicht der Use Case den engen Austausch mit dem Schwesterprojekt KI Absicherung der KI Projektfamilie, welches exemplarisch den gleichen Use Case betrachtet. Für die Datengenerierung existieren unterschiedliche Ansätze, die in diesem Vorhaben erstmals umfassend und gemeinsam betrachtet und gegenübergestellt werden, um ihre Nutzung für das Training von KI-Methoden in der Praxis zu untersuchen: Verwendung aufbereiteter Realdaten, synthetisch generierte Daten sowie hybride Ansätze, welche Realdaten synthetisch augmentieren. Durch die integrierte Betrachtung von Realdaten und synthetischen Daten sowie der Nutzung von Effizienzpotentialen bei deren Kombination wird in diesem Vorhaben erstmals eine „Daten-Factory“ als Komplettlösung für das Training und die Validierung von KI-basierten automatisierten Fahrfunktionen erzeugt. Datei-Upload durch TIB
The use of algorithms that employ artificial intelligence methods is currently seen as one of the key factors in the efficient implementation of automated driving functions. Training, validation and, above all, test data are essential for the development and validation of such AI systems in the automotive environment. As AI systems have to be comprehensively trained and validated, the availability of a suitable database can make a significant contribution to shortening development cycles. KI Data Tooling addresses this need systematically and comprehensively for the first time. KI Data Tooling functions as a component of the KI-Projektfamilie within the VDA-LI for Autonomous and Connected Driving. As part of the VDA-LI, open issues in the implementation of automated driving functions were identified and grouped into projects and project families. As part of the KI-Projektfamilie, which deals with issues relating to the use of artificial intelligence for automated driving functions, KI Data Tooling will be in close contact with the other projects in order to exchange requirements, collected data and developed methods. KI Data Tooling develops methods and tools that enable the description, processing, selection, generation, compression and provision or transfer of data, such as individual images or sequences of different camera, radar or lidar sensor impressions of relevant scenarios. The aim is to create a database for the training, validation, testing and safeguarding of AI systems. Solutions are created that make it possible to efficiently and systematically use and further utilize data of different quality, different origins (synthetically generated or based on real data), different sensor setups or technologies. In order to verify the methods and tools, they are used and optimized using the example of the pedestrian detection use case. This use case enables the methods and tools to be assessed directly on the basis of specific requirements for the resulting data and is central to the successful use of automated driving functions. In addition, the training of pedestrian detection algorithms benefits from the inclusion of synthetic data, as this allows dangerous borderline situations to be systematically mapped. Finally, the use case enables a close exchange with the sister project AI Safeguarding of the AI project family, which uses the same use case as an example. Different approaches exist for data generation, which are being examined and compared comprehensively and jointly for the first time in this project in order to investigate their use for training AI methods in practice: Use of processed real data, synthetically generated data as well as hybrid approaches that synthetically augment real data. Through the integrated consideration of real data and synthetic data as well as the use of efficiency potentials in their combination, this project will for the first time create a "data factory" as a complete solution for the training and validation of AI-based automated driving functions.
