Wie erstelle ich einen hochwertigen Datensatz zur Anomalieerkennung?

Autor

David Fehrenbach

David ist Geschäftsführer von preML und schreibt über technologie- und geschäftsbezogene Themen im Bereich Computer Vision und maschinelles Lernen.

Ein großer Vorteil von Anomalie-Erkennungsmodellen ist, dass sie ausschließlich mit Bildern trainiert werden, die das ideale Erscheinungsbild eines Objekts repräsentieren. Das bedeutet, man benötigt lediglich Aufnahmen von fehlerfreien Objekten. Alle später auftretenden Abweichungen, die nicht in diesen Trainingsdaten enthalten sind, werden automatisch als Anomalien identifiziert – und genau das macht diese Methode so effizient und unkompliziert. Allerdings ist im Umkehrschluss auch wichtig, beim Erstellen eines neuen Datensatzes darauf zu achten, dass dieser alle erlaubten Variationen abbildet. Hier erfahren Sie wie das geht!

Bild 1: Unser Cheat Sheet – Dos and Don’ts when creating a dataset for Anomaly Detection (c) preML GmbH

Die Qualität des Datensatzes ist entscheidend – auf was Sie achten sollten.

Im Idealfall werden die Trainingsdaten unter den gleichen Bedingungen (z. B. Blickwinkel, Beleuchtung, Positionierung usw.) aufgenommen wie bei den späteren Test-Bildern. Die Bedingungen sollten sich möglichst nicht mehr verändern. Falls sich dies nicht vermeiden lässt, sollten in den Trainingsdaten möglichst alle verschiedenen Bedingungen vorkommen.

Da Anomalie-Erkennungsmodelle nicht zwischen dem Objekt und dem Hintergrund unterscheiden, muss auch der Hintergrund möglichst immer gleiche Bedingungen haben. Ein einfarbiger Hintergrund ohne Schmutz erleichtert zudem das Training und verringert die Fehleranfälligkeit.

Kann das Objekt unterschiedlich gedreht sein, sollte auch jede erlaubte Drehung vorkommen.

Bild 2: „Normal“ Trainingsdaten für ein Anomalie-Modell. Klarer Kontrast zu einem gleichmäßigen Hintergrund, alle erlaubten Drehungen, und eine gleichmäßige Beleuchtung (c) preML GmbH

Optimale Bildanzahl und iterative Modellverbesserung für präzise Anomalieerkennung

Die Anzahl der benötigten „Normal“ Bilder für das Training hängt davon ab, wie viele Variationen erlaubt sind. Bei industriell gefertigten Bauteilen, die stets gleich aussehen und in der gleichen Position auf dem Fließband liegen, können bereits sehr wenige Bilder (7-10) ausreichen, um erste gute Ergebnisse zu erzielen. Kommen jedoch zwangsweise einige Variationen vor, wie beispielsweise bei Äpfeln, welche in verschiedenen Formen, Farben und Drehungen vorkommen können, werden mehr Bilder benötigt (30-40).

Mit preMLs iterativen Ansatz kann zunächst mit wenigen Bildern ein Modell trainiert werden. Wird ein Live System verwendet, wie z. B. im Webcam-Tool der Demo-Version, können falsch klassifizierte Bilder dann einfach zum Datensatz hinzugefügt werden, um das Modell mit wenigen Klicks nachzutrainieren und damit verbessern. Dieser Vorgang kann beliebig oft wiederholt werden. Es empfiehlt sich daher, mit wenigen Bildern zu beginnen und das Modell anschließend kontinuierlich zu verbessern.

Bild 3: Im Image Explorer der Platform können Datensätze verwaltet werden und bei Fehlentscheidungen das Modell mit den entsprechenden Bildern einfach nachtrainiert werden. (c) preML GmbH

Automatische Schwellwert-Bestimmung mit Anomalie-Bildern

Der Schwellwert bestimmt, ab welchem Wert eine Abweichung als Anomalie klassifiziert wird. Somit kann eingestellt werden, wie empfindlich das Modell auf Abweichungen reagiert. Wenn der Schwellwert erhöht wird, werden weniger Bereiche als Anomalien betrachtet und umgekehrt. Der Schwellwert kann manuell beim Testen mit Fehlerbildern angepasst werden. Mit der preML Software ist es zudem möglich, automatisch einen möglichst guten Schwellwert bestimmen zu lassen.

Dazu werden auch allerdings Testbilder benötigt, insbesondere auch Bilder mit Anomalien. Die Software optimiert dann den Schwellwert, sodass möglichst viele Testbilder richtig klassifiziert werden.

Auswahl des passenden Modells

In den meisten Fällen wird PatchCore das richtige Modell für die Anwendung sein, da es üblicherweise bessere Ergebnisse liefert. Ist die Position des Objekts wichtig, sprich soll eine Verschiebung als Fehler erkannt werden, sollte das Modell PaDiM gewählt werden.

Und jetzt viel Spaß beim Ausprobieren!