KI-LOK: KI-Lokomotivesysteme - Prüfverfahren für KI-basierte Komponenten im Eisenbahnbetrieb

Loading...
Thumbnail Image

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek

Link to publishers version

Abstract

Die Ziele und Aufgaben des Projektes wurden auf dem zu Beginn des Projekts aktuellen Stand der Technik aufgebaut:

  1. Ausgangssituation bei Verifikations- und Validierungstechniken für ML: Die Forschung an dedizierten Methoden zur Verifikation und Validierung von KI stand am Anfang. Da klassische Verifizierungs- und Validierungsansätze auf Grund unvollständiger Spezifikationen begrenzt anwendbar waren und sind, wurde unter anderem Formale Methoden und Ansätze zur Quantifizierung der neuronalen Abdeckung von KI-Modellen in Betracht gezogen, haben sich aber als nicht Zielführend herausgestellt.
  2. Ausgangssituation beim modellbasierten Test von KI-basierten Bahntechnikkomponenten: Das systematische Testen von Software ist eine der bekanntesten und effektivsten Verifikations- und Validierungsmethoden für softwarebasierte Systeme, sie wurde in der Form des Partition Testings als Schwerpunkt der KI-Validierungsmethode gewählt.
  3. Ausgangssituation zu Absicherungs- und Abnahmeprozessen für KI-basierte Bahntechnikkomponenten: Zu Beginn des Projektes waren keine Methoden bekannt, die eine Zulassung im sicherheitskritischen Bereich von KI-Komponenten nach EN 50128 ermöglicht hätten.

Das Ziel des Forschungsprojekts KI-LOK war eine werkzeuggestützte Methodik für die Absicherung von KI-Komponenten im Bahnbereich zu entwickeln und die Ergebnisse als Proof-of-Concept (POC), anhand von ausgewählten Szenarien als praktische Beispiele darzustellen. Automatisiert fahrende Züge bringen ein hohes Potenzial mit sich, die Qualität des Verkehrsangebotes für Personen- und Güterverkehr zu stabilisieren und zu erhöhen, die Ressourceneffizienz und Nachhaltigkeit der Züge deutlich zu steigern und einem absehbaren Fachkräftemangel bei TriebfahrzeugführerInnen vorzubeugen. Das KI-LOK Projekt sollte durch die Entwicklung einer Absicherungsmethodik helfen, die Lücke in der Zulassung von automatisierten Fahrfunktionen auf Grundlage von System mit KI-Komponenten zu verkleinern. Die Absicherungsmethodik muss die statistische Natur von KI berücksichtigen. Denn KI-Systeme nutzen statistische Verfahren zur Mustererkennung. Das hat zur Folge, dass es immer eine nicht verschwindende Wahrscheinlichkeit gibt, mit der ein Testfall negativ verläuft, wenn nur minimale Änderungen an den Eingabeparametern vorgenommen werden (nicht deterministisches Verhalten). Dies stellt einen Paradigmenwechsel im Softwaretest dar, da die Annahme, dass ein Test mit ähnlichen Eingaben in eine Software-Komponente immer ähnliche Ausgaben zur Folge hat (deterministisches Verhalten) nicht mehr gilt. Auf Grundlage des Standes der Technik zu Beginn des Projekts wurden daraus folgende Aufgaben abgeleitet:

  1. Die Entwicklung von Validations- und Verifikationstechniken und -Werkzeugen, die speziell die Besonderheiten des ML (Machine Learning) und der KI-Algorithmen berücksichtigen.
  2. Die Entwicklung von Testverfahren und Methoden, die für den Test selbst wiederum KI-Technologie bzw. andere such- und datengetriebener Optimierungsverfahren zur Bestimmung einer optimalen Testgenerierung und -auswahl verwenden.
  3. Die Entwicklung von Prozessen für die Zulassung sicherheitskritischer Software mit KI-Anteilen für den Bahnbetrieb.

Methode:

  • Recherche über vorhandene Methoden des Prüfverfahrens von KI-Komponenten
  • Untersuchung über die Herstellung möglicher Analogien zu den Prüfverfahren konventioneller Software
  • Entwicklung innovativer Prüfverfahren unter Berücksichtigung der probabilistischen Natur von KI-Komponenten
  • Mathematische Fundierung der entwickelten Methoden

Ergebnisse: Im KI-LOK-Projekt wurde ein KI-Absicherungsprozess (Safety Evaluation Process) entwickelt, in dessen Rahmen die ITPower Solutions GmbH (ITPower) vor allem an der Entwicklung eines systematischen (Blackbox) Tests für KI-Komponenten beteiligt war. Für den systematischen Test hat ITPower gemeinsam mit Fraunhofer FOKUS sowohl die Systematik, als auch die stochastischen Grundlagen erarbeitet. Dies machte den Hauptteil der Projektarbeit aus. Der systematische Test von KI-Komponenten stellt die statistische Natur von KI in den Mittelpunkt in dem er eine Methode bereitstellt, um ein repräsentatives statistisches Referenzmodell für die Betriebsumgebung (Operational Design Domain - ODD) zu erstellen. Das Referenzmodell wird erstellt, in dem die Objekte der ODD in einer Ontologie als Klassen mitsamt ihren Abhängigkeiten modelliert werden. Diesen Klassen werden dann mit Wahrscheinlichkeitsverteilungen (abgeleitet aus statistischen Daten oder modelliert mit gesundem Menschenverstand, die empirisch validiert werden) erweitert. So entsteht eine Probabilistisch Erweiterte ONtologie (PEON), die das statistische Referenzmodell der ODD darstellt. Entsprechend der PEON können automatisiert und systematisch abstrakte Testfälle erstellt werden, die dann entweder durch reale Testdaten (Bilder oder Videos im Fall einer Objekterkennung) oder synthetische Testdaten aus einer 3D-Simulation realisiert werden können. Innerhalb des KI-LOK-Projektes und dem Demonstrator des Safety Evaluation Process wurde vom Projektpartner Fraunhofer FOKUS eine 3D-Simulation erstellt, die zur Generierung der Testdaten benutzt wurde. Neben dem Hauptteil, dem Systematischen Blackbox Test von KI-Komponenten, wurde an der Anwendung des metamorphen Tests auf Bilderkennungssysteme gearbeitet. Der metamorphe Test ist eine Software-Testmethode, bei der ein kovarianter Zusammenhang zwischen Eingabe und Ausgabe überprüft wird. Der Vorteil dieser Testmethode liegt darin, dass unter Berücksichtigung des kovarianten Zusammenhangs neue Testdaten erstellt werden können, zu denen das Testergebnis aus dem kovarianten Zusammenhang abgeleitet werden kann. Im Fall eines Bilderkennungsalgorithmus werden Bilder auf Grundlage ihres Inhalts klassifiziert, der kovariante Zusammenhang besteht in diesem Fall aus dem Label des Bildes und der Klassifikation des Bildes entsprechend dieses Labels. Um die Klassifikation Testen zu können, müssen Datensätze mit gelabelten Bildern vorliegen. Das Labeling von Trainings- und Testdaten ist sehr Ressourcen-intensiv. Hier setzt die metamorphe Testmethode an und transformiert die Testdaten (Testbilder), mit metamorphen Transformationen (z.B. Verwackeln, Änderung von Lichtverhältnissen, Hoch- und Tiefpass Filter, Linsenfehler) die die Testbilder zwar ändern, aber ihr Label und damit die zu erwartende Klassifikation unberührt lassen.

Die durch ITPower Solutions erarbeiteten Projektergebnisse füllen eine methodische Lücke im Bereich des Tests von KI-Komponenten auf und eignen sich deshalb hervorragend für die Verwertung im Bahnbereich, aber auch in anderen Industriebranchen, die klassifizierende KI-Komponenten entwickeln und einsetzen. Somit bestehen für diese Methoden sowohl brancheneigene als auch branchenfremde Anwendungspotentiale.

Datei-Upload durch TIB


The objectives and tasks of the project were based on the current state of the art at the start of the project:

  1. The initial situation for verification and validation techniques for ML: Research on dedicated methods for the verification and validation of AI was in its infancy. Since classical verification and validation approaches were and are of limited applicability due to incomplete specifications, formal methods and approaches for quantifying the neural coverage of AI models were considered, among other things, but turned out not to be effective.
  2. The initial situation in the model-based testing of AI-based railway technology components: Systematic testing of software is one of the best known and most effective verification and validation methods for software-based systems; it was chosen in the form of partition testing as the focus of the AI validation method.
  3. The initial situation for validation and acceptance processes for AI-based railway technology components: At the start of the project, no methods were known that would have enabled approval in the safety-critical area of AI components in accordance with EN 50128.

The aim of the KI-LOK research project was to develop a tool-supported methodology for the validation of AI components in the railway sector and to present the results as a proof of concept (POC) using selected scenarios as practical examples. Automated trains have great potential to stabilise and improve the quality of passenger and freight transport services, significantly increase the resource efficiency and sustainability of trains and prevent a foreseeable shortage of skilled train drivers. By developing a validation methodology, the KI-LOK project should help to reduce the gap in the approval of automated driving functions based on systems with AI components. The validation methodology must take into account the statistical nature of AI. This is because AI systems use statistical methods to recognise patterns. As a result, there is always a non-vanishing probability that a test case will be negative if only minimal changes are made to the input parameters (non-deterministic behaviour). This represents a paradigm shift in software testing, as the assumption that a test with similar inputs to a software component always results in similar outputs (deterministic behaviour) no longer applies. Based on the state of the art at the start of the project, the following tasks were derived from this:

  1. the development of validation and verification techniques and tools that specifically take into account the special features of ML (machine learning) and AI algorithms.
  2. the development of test procedures and methods that in turn use AI technology or other search- and data-driven optimisation procedures for the test itself to determine optimal test generation and selection.
  3. the development of processes for the approval of safety-critical software with AI components for railway operations.

Method:

  • Research into existing methods of testing AI components
  • Investigation of possible analogies to the testing methods of conventional software
  • Development of innovative test procedures taking into account the probabilistic nature of AI components
  • Mathematical foundation of the developed methods

Results: Within the KI-LOK project an AI safety evaluation process was developed in which ITPower Solutions GmbH (ITPower) was primarily involved in the development of a systematic (black box) test for AI components. Together with Fraunhofer FOKUS, ITPower developed both the system and the stochastic principles for the systematic test. This made up the main part of the project work. The systematic test of AI components focuses on the statistical nature of AI by providing a method for creating a representative statistical reference model for the operational design domain (ODD). The reference model is created by modelling the objects of the ODD in an ontology as classes together with their dependencies. These classes are then extended with probability distributions (derived from statistical data or modelled with common sense, which are empirically validated). This creates a Probabilistic Extended ONtology (PEON), which represents the statistical reference model of the ODD. According to the PEON, abstract test cases can be created automatically and systematically, which can then be realised either using real test data (images or videos in the case of object recognition) or synthetic test data from a 3D simulation. Within the KI-LOK project and the demonstrator of the Safety Evaluation Process, the project partner Fraunhofer FOKUS created a 3D simulation that was used to generate the test data. In addition to the main part, the systematic black box test of AI components, work was carried out on the application of the metamorphic test to image recognition systems. The metamorphic test is a software test method in which a covariant relationship between input and output is checked. The advantage of this test method is that new test data can be created taking the covariant relationship into account, for which the test result can be derived from the covariant relationship. In the case of an image recognition algorithm, images are classified on the basis of their content; in this case, the covariant relationship consists of the image label and the classification of the image according to this label. In order to be able to test the classification, data sets with labelled images must be available. The labelling of training and test data is very resource-intensive. This is where the metamorphic test method comes in and transforms the test data (test images) with metamorphic transformations (e.g. blurring, changes in lighting conditions, high- and low-pass filters, lens errors) that change the test images but leave their label and thus the expected classification unaffected.

The project results developed by ITPower Solutions fill a methodological gap in the field of testing AI components and are therefore ideally suited for utilisation in the railway sector, but also in other industrial sectors that develop and use classifying AI components. This means that there is potential for these methods to be utilised both within and outside the industry.

Description

Keywords

License

Es gilt deutsches Urheberrecht. Das Werk bzw. der Inhalt darf zum eigenen Gebrauch kostenfrei heruntergeladen, konsumiert, gespeichert oder ausgedruckt, aber nicht im Internet bereitgestellt oder an Außenstehende weitergegeben werden. - German copyright law applies. The work or content may be downloaded, consumed, stored or printed for your own use but it may not be distributed via the internet or passed on to external parties.