Von Václav Diviš, Senior Expert Machine Learning bei ARRK Engineering.
Fahrassistenzsysteme (ADAS) sind nicht nur ein Standardaccessoire in jedem Neuwagen, sondern auch ein wichtiger Meilenstein auf dem Weg zum autonomen Fahren. Je mehr die technischen Helfer selbstständig können sollen, desto besser wollen die dem System zugrundeliegenden neuronalen Netze trainiert werden. So wachsen auch die verwendeten Datensätze immer weiter an. Doch inwiefern spiegeln die Trainingsdaten überhaupt die operativen Einsatzbereiche der ADAS wider? Dies ist oftmals zweitrangig. Um die Fehleranfälligkeit der Systeme zu reduzieren, wurde bisher lediglich die Quantität der Daten erhöht. Das Ergebnis sind unnötig komplexe, langwierige und ineffiziente Entwicklungsprozesse. ARRK Engineering hat daher einen Ansatz entwickelt, mit dem fehlerhafte oder die Realität verzerrende Daten korrigiert bzw. entfernt und die ADAS zielgenau, zuverlässig und ressourceneffizient trainiert werden können.
Namhafte OEMs machen es, Mobility-Startups tun es ihnen gleich und Verbraucher wollen es: In immer mehr Fahrzeugen werden Fahrassistenzsysteme der Automatisierungsstufen 2 und 3 verbaut. Tagtäglich verlassen sich zahlreiche Verkehrsteilnehmer auf Spurhalteassistenten, automatische Einparkhilfen und Adaptive Cruise Control (ACC). Um die Sicherheit auf den Straßen zu gewährleisten, werden die Systeme mithilfe riesiger Datensätze trainiert.
Riesige Datensätze: der Teufelskreis der Masse
Je komplexer die Funktionalitäten der unterschiedlichen ADAS sind, desto spezifischere Datensätze werden für deren Trainings benötigt. Um all die individuellen Verkehrssituationen abzudecken, wurden die Datenmodelle in den letzten Jahren immer weiter vergrößert. Der Fokus lag dabei primär auf Masse an enthaltenen Aufnahmestunden oder annotierten Objekten bei unterschiedlichen Wetterlagen und Lichtverhältnissen. Dies führt jedoch dazu, dass sich auch der Anteil der fehlerhaften oder für einen bestimmten operativen Einsatzbereich unpassenden Daten proportional erhöht. Um sicherzustellen, dass die neuentwickelten ADAS weiterhin zuverlässig funktionieren, wurde dieses Qualitätsdefizit mit Quantität kompensiert – ein Teufelskreis. Die Folge sind sehr lange Entwicklungszeiten mit vielen Iterationsschleifen.
Um diesem Dilemma zu entfliehen, muss die Automobilindustrie den Fokus weg von der Quantität und hin zur Qualität der Datensätze zu verschieben. Die Machine Learning-Spezialisten von ARRK Engineering haben einen Ansatz entwickelt, um die Prozesse im Hinblick auf einen operativen Einsatzbereich zu validieren und bei Bedarf entsprechend zu korrigieren. Auf diese Weise lässt sich das Development effizienter gestalten und, wichtiger noch, auch die funktionale Sicherheit der ADAS erhöhen.
Beispiel ACC: Analyse der Datensätze hinsichtlich der Trajektorienplanung
Die ADAS-Funktion ACC hält das Fahrzeug mit einer bestimmten Geschwindigkeit auf der Fahrspur und stellt dabei einen ausreichenden Abstand zu anderen Verkehrsteilnehmern und Hindernissen sicher. Dafür berechnet das System zu jedem erkannten Objekt die sogenannte Time-To-Collision (TTC). Sinkt diese unter einen definierten Schwellenwert, dann reagiert das Fahrzeug mit Brems- oder Ausweichmanövern. Dabei gilt: Je größer die Geschwindigkeitsdifferenz zwischen dem Fahrzeug und einem davor befindlichen Objekt ist, desto kürzer ist die TTC und desto früher muss das ACC reagieren. Deswegen muss das System z. B. Objekte auf Autobahnen in deutlich größerer Entfernung zuverlässig erkennen, wohingegen der nahe Bereich, in dem sich ein potentielles Hindernis befinden kann, im städtischen Umfeld größer ist. Doch sind die ADAS-Funktionen der unterschiedlichen Hersteller dazu überhaupt in der Lage? Um dies herauszufinden, legten die Forschenden den Fokus auf die Trajektorienplanung. Für den Einsatzort Deutschland definierten sie drei Fahrszenarien mit variierenden Anforderungen an das ACC: Autobahn (130 km/h Richtgeschwindigkeit), Landstraße (max. 100 km/h) und Stadtverkehr (max. 50 km/h).
Für ihre Analyse zogen die Experten insgesamt sechs Datensätze heran, darunter große Modelle, die seit Jahren von namhaften OEMs genutzt werden: ONCE, nuScenes, A2D2, LyftLevel5, Waymo und Kitti. Ziel war zunächst, die statistische Verteilung der annotierten Objekte herauszufinden, die das System erkennen kann. Dabei spielten etwa die Größe der zur Annotation genutzten Bounding Boxes, das Verhältnis zwischen ihrer Größe und Entfernung zueinander, der Abstand zwischen dem Fahrzeug und anderen Objekten sowie deren relative Positionsverteilung auf dem Sensor und der optische Fluss der Bildsequenzen eine Rolle. Mithilfe dieser Parameter ermittelten die Forschenden, wie präzise die Objekte annotiert und entsprechend mit Bounding Boxes versehen wurden. Zudem untersuchten sie, wie gut die Kamerasensoren der Fahrzeuge auf ihre operativen Einsatzbereiche eingestellt waren und welchen Anteil z. B. Stehphasen ausmachen, bei denen über einen längeren Zeitraum (nahezu) statische Bilder erfasst wurden.
Optimierung der untersuchten Datensätze
Die Ergebnisse der Analysen und die daraus abgeleitete Qualität der Datensätze überraschten die Machine Learning-Spezialisten von ARRK Engineering – in negativer Hinsicht. So entdeckten sie etwa unerwartet viele statische Bilder aus Stau- und Stehphasen, die nicht als solche markiert waren und daher die Detektor-Trainings der ACCs negativ beeinflussen können. Im Gegensatz dazu ließen alle untersuchten Datenmodelle annotierte Objekte in größeren Entfernungen ab rund 100 m komplett vermissen. Aufgrund der kurzen TTC bei Geschwindigkeiten von etwa 130 km/h ist das zuverlässige Erkennen von derart weit entfernten Hindernissen allerdings unabdingbar für den sicheren Einsatz des ADAS auf Autobahnen in der Bundesrepublik. Zudem ist die Annotation der Objekte oftmals ungenau, da viele Personen mit unterschiedlichen Herangehensweisen an den Datensätzen arbeiten. Um dies auszugleichen, werden die Bounding Boxes großzügiger als nötig festgelegt und überlappen sich häufig. Dies macht es für die Systeme wiederum schwieriger, Hindernisse auszumachen, und verlängert die Trainingsprozesse drastisch.
Ziel der Forschenden ist es nunmehr, die mangelhafte Qualität der Datensätze im Hinblick auf die Entwicklung von ADAS der Levels 2 und 3 zu steigern. Daher entwickelten sie einen Ansatz, um die Modelle in Bezug auf die operativen Einsatzbereiche der Systeme zu validieren und ihre Defizite entsprechend zu korrigieren. Indem z. B. Aufnahmen mit deutlich überlappenden Bounding Boxes sowie statische Bilder eliminiert werden, lässt sich die Präzision und Generalisierung der Detektortrainings erhöhen. Zudem ermöglichen die Untersuchungsergebnisse, die Tauglichkeit eines Datensatzes für ein konkretes Einsatzszenario überhaupt erst festzustellen und bei den Trainings entsprechend zu berücksichtigen bzw. zu ergänzen. Im Fall des ACC betrifft dies etwa Fahrten innerorts, auf dem Land oder auf Autobahnen. Indem die Kamerasensoren zudem besser auf das tatsächliche Verkehrsgeschehen hin ausgerichtet werden, lassen sich die Effizienz der Berechnungen und somit auch die Reaktionszeit des ACC verbessern.
Höhere Sicherheit auf den Straßen dank validierter Datensätze
Datensätze, die mit den neuentwickelten Ansätzen von ARRK Engineering validiert werden, ermöglichen es, die erforderlichen Iterationsschleifen im Trainingsprozess und somit die gesamte Entwicklungsdauer der ADAS maßgeblich zu reduzieren. Durch effizientere Trainings lässt sich also bereits im Development wertvolle Zeit einsparen. Hinzu kommt, dass präzise auf ihren operativen Einsatzbereich hin trainierte Systeme auch eine höhere funktionale Sicherheit aufweisen. So kann das ACC im praktischen Einsatz etwa bewegte Objekte sowie stillstehende Hindernisse zuverlässiger erkennen und rechtzeitig entsprechende Brems- oder Ausweichmanöver initiieren. Insbesondere im Hinblick darauf, dass sich auf dem Weg zum autonomen Fahren in Zukunft immer mehr und hochfunktionalere ADAS auf unseren Straßen bewegen, erhöht sich so die allgemeine Sicherheit im täglichen Straßenverkehr.
Das Paper wurde im Rahmen der Konferenz SafeAI 2023 vorgestellt: https://safeai.webs.upv.es/
ARRK Engineering ist ein global aktiver Entwicklungspartner für die Automobil- und Mobilitätsindustrie, der seit über 50 Jahren auf eine durchgehende und umfassende Unterstützung des gesamten Produktentwicklungs-prozesses spezialisiert ist – von der Konzeptionsphase über die Serienentwicklung bis hin zu Validierung und Systemintegration von mechanischen und elektronischen Komponenten. Innerhalb der Schwerpunktthemen arbeitet ARRK Engineering in interdisziplinären Expertenteams mit dem Ziel, Projekte schnell und technisch umfassend zu realisieren. Gepaart mit einem exzellenten Projektmanagement löst ARRK Engineering so die komplexen Entwicklungsaufgaben seiner Kunden mit hoher Qualität und hoher Kundenzufriedenheit. Dazu vertraut ARRK Engineering auf die langjährige, interdisziplinäre Expertise seiner 1.600 Mitarbeiter an Standorten in Deutschland, Rumänien, China, den Niederlanden, Malaysia und Japan. Als Mitglied des internationalen ARRK Konzerns stehen ARRK Engineering weitere Ressourcen weltweit zur Verfügung, um auch Kunden auf den globalen Märkten zu unterstützen.
ARRK Engineering GmbH
Frankfurter Ring 160, 80807 München
Tel.: +49 (0) 89 31857-0, Fax: +49 (0) 89 31857-111
E-Mail: info@arrk-engineering.com
Internet: www.arrk-engineering.com
Mehr Info für die Redaktion
ABOPR Pressedienst B.V.
Stefan-George-Ring 19, 81929 München
Tel.: +49 (0) 89 500 315-20, Fax: +49 (0) 89 500 315-15
E-Mail: info@abopr.de
Internet: www.abopr.de