Unsicherheitsschätzung für xAI

Die einfachste Erklärung, die ein Modell liefern kann, ist eine Schätzung, wie unsicher seine Vorhersage ist. Wenn so eine Unsicherheitsschätzung präzise genug ist, können Nutzer:innen dem Modell bei hoher Zuverlässigkeit vertrauen und bei niedriger Zuversicht das System weiter trainieren oder mehr Daten verlangen.

Bei SAL hat eine Forschungsgruppe um Federico Pittino von der Forschungsunit Collaborative Perception & Learning einen Ansatz zur Unsicherheitsschätzung in der Vorhersage des Volumens von Obst und Gemüse auf einem Tisch getestet. Dabei hat ein Nutzer eine kurze Videosequenz des Objekts mit einem Smartphone gefilmt und ein Modell wurde darauf trainiert, die Objektklasse und deren Volumen zu visualisieren. Für die Unsicherheitsschätzung wurde schließlich ein auf Ensembling und einem GNLL-Verlust basierter Ansatz verwendet, der die theoretische Genauigkeit von 95% bei einer 2σ-Schwelle erreichte.

Hierarchical concept bottleneck

Bei der Segmentierung von Bildern und der Klassifizierung von Objekten erweist es sich in realen Anwendungen manchmal als schwierig, Modelle zu erlangen, die eine genaue und zuverlässige Feinklassifizierung durchführen können. Kürzlich wurden Concept Bottleneck-Modelle für die Klassifizierung von Bildern vorgeschlagen, die das Problem in zwei Stufen unterteilen und dadurch eine Hierarchie von Konzepten definieren. Bislang wurde jedoch nur wenig getan, um die Anwendbarkeit dieses Ansatzes auf andere Datensätze mit höherer Intra-Klassen-Variabilität und Ambiguität zu untersuchen und seine Anpassungsfähigkeit auf andere Aufgaben als die Klassifizierung ganzer Bilder zu diskutieren.

Bei SAL haben Federico Pittino, Vesna Dimitrievska und Rudolf Heer ein Concept Bottleneck Modell für die Segmentierung von Bildern und die Feinklassifizierung von Objekten und deren Nachverfolgung entworfen. All ihre Modelle wurden mittels einem Datensatz von Bildern von Kühlschränken, die mit verschiedensten Objekten gefüllt waren, trainiert und getestet – aber diese Methode kann auf jede beliebige Feinklassifizierung angewandt werden. Das vorgeschlagene Modell nutzt dabei die Hierarchie der Konzepte in vollem Umfang, indem es die Beziehung zwischen verschiedenen Kategorien auf derselben hierarchischen Ebene ausnutzt und sich auf eine neue Methode zur Handhabung von multi-label Klassifikationen stützt. Die Forschungsgruppe hat damit gezeigt, dass die Leistung bei der Feinklassifizierung gleichwertig mit der eines regulären Mask R-CNN ist, jedoch mit einer erheblichen Verbesserung der Erklärbarkeit und des Umgangs mit Verwirrungen bezüglich verschiedener Klassen. Es wurden auch neue erklärbare Metriken vorgeschlagen, um die Zunahme der Erklärbarkeit quantitativ zu bewerten. Die Forschungsgruppe hat ebenso die Wirksamkeit der abgeleiteten Concept Bottleneck-Merkmale bei verwandten Aufgaben demonstriert, zum Beispiel beim Tracking von Objekten zwischen aufeinanderfolgenden Bildern in einer Sequenz. Ihre Arbeit wurde in Engineering Applications of Artificial Intelligence veröffentlicht und kann online eingesehen werden:

https://www.sciencedirect.com/science/article/pii/S0952197622006649.