KI in der Lebensmittelindustrie
Herausfordernd ist die aufwendige Erstellung geeigneter Trainingsdaten für DL-Systeme und deren Wartung. DL-Ansätze mit Millionen von Parametern erfordern viele Daten.
Die Diskussionen rund um Künstliche Intelligenz (KI), insbesondere im Bereich des Deep Learning (DL), werden oft enthusiastisch geführt. Es wird behauptet, dass damit präzise Prognosen erstellt, hochspezialisierte automatisierte Bewertungen durchgeführt und sogar neue Produktionsanlagen und Qualitätskontrollsysteme realisiert werden können. Doch ist das wirklich so, oder sollten wir diese Entwicklungen kritischer betrachten? Tatsächlich ist beides zutreffend.
Zuerst sollten wir die beiden größten Herausforderungen beleuchten: die aufwendige Erstellung von geeigneten Trainingsdaten für DL-Systeme und die problematische Wartung solcher Systeme. Danach werden wir mögliche Lösungsansätze betrachten, die es ermöglichen, Projekte umzusetzen, die bisher kaum denkbar waren und eine schnellere Entwicklung von effizienteren und nachhaltigeren Lösungen in Aussicht stellen.
Die Grundlagen der Mathematik hinter DL sind eigentlich recht simpel. Sie beruhen auf einfachen „linearen“ Gleichungen mit wenigen Parametern. Die Komplexität steigt jedoch, wenn diese Grundelemente vielfach verwendet werden und dann Millionen von Parametern im Spiel sind. Aus der Statistik wissen wir, dass für die Berechnung stabiler (Gleichungs-) Systeme viele Daten benötigt werden. Bei DL-Ansätzen mit Millionen von Parametern bedeutet dies, dass entsprechend viele Daten für das Training erforderlich sind, um die Systeme stabil zu machen. Es ist ein Irrtum zu glauben, dass dies nicht notwendig ist, nur weil gute Ergebnisse mit weniger Daten erzielt werden können; bei zu wenigen Daten können Extrapolationen, also Anwendungen auf unbekannte Daten aus der Produktion, fehlerhaft sein.
Hier liegt eine zentrale Herausforderung: Diese Daten, in der Bildverarbeitung bspw. Bilder mit den zu analysierenden Objekten, müssen zunächst manuell bewertet werden. Das bedeutet, dass je nach Komplexität der Aufgabe, bisweilen etliche tausend Bildern manuell begutachtet und bewertet werden müssten. Dies ist zeitaufwändig und kostspielig. Die Reduzierung dieses Aufwands ist entscheidend, um DL-Systeme auch für kleinere Anwendungen praktikabel zu machen.
Die andere Herausforderung besteht darin, DL-Systeme effektiv zu warten. In der herkömmlichen Softwareentwicklung können Entwickler den Quellcode verstehen und Schritt für Schritt analysieren, um Fehler zu finden. Bei DL-Systemen ist dies jedoch nicht möglich. Solange das Umfeld stabil ist und ausreichend Trainingsdaten vorhanden sind, ist dies selten ein Problem. Aber wie bereits erwähnt, mangelt es oft an Trainingsbeispielen, und das Umfeld kann sich ändern (z. B. durch Wettereinflüsse oder Verpackungsmaterial), was zu weiteren Fehlerquellen führt.
Durch die Lösungsansätze für diese Herausforderungen kann ein Unternehmen, das DL-Technologien einsetzen möchte, erfahrene Anwender von weniger Erfahrenen unterscheiden. Unsere Erfahrung zeigt, dass Prototypen zwar schnell entwickelt werden können, langfristig stabile DL-Systeme erfordern aber eine gründliche Auseinandersetzung mit den oben genannten Themen.
Lösungsansätze:
Bei CLK verwenden wir verschiedene Ansätze, um die Herausforderung der Datenmenge zu bewältigen:
- Technisch: Wir setzen Verfahren ein, die schnell erkennen können, welche Muster wichtig sind und welche nicht. Dadurch ist nur ein Bruchteil der Muster manuell zu bewerten. Wir nutzen auch Verfahren, die im Laufe der Zeit allgemeineres Wissen lernen, wodurch wir für neue Aufgaben weniger Daten benötigen.
- Organisatorisch: Wir haben eine spezialisierte Arbeitsgruppe für die Annotation von Daten. Die Werkzeuge zur effizienten Bearbeitung der Daten durch die Gruppe werden kontinuierlich verbessert.
Die Herausforderung der Wartung von DL-Systemen, d. h., die Identifizierung von Fehlern und deren Behebung, kann durch eine klare Zerlegung des Projekts in kleine Aufgabenstellungen gelöst werden. Der Ansatz, ein großes DL-System zu erstellen, das alle Aufgaben umfasst, birgt die Gefahr, dass Fehler nicht lokalisiert werden können. Eine passende Modularisierung hilft, dieses Problem zu lösen. Die Aufteilung in kleine Pakete wird so weit möglich durch klassische Bildverarbeitung und Logik bearbeitet, um verständliche und wartbare Lösungsabschnitte für den Benutzer bereitzustellen. Teilaufgaben, die damit nicht gelöst werden können, behandeln wir mit passenden bzw. angepassten DL-Verfahren.
Anwendungen
Unter Berücksichtigung dieser Aspekte kann Deep Learning erfolgreich in verschiedenen Bereichen der Lebensmittelindustrie eingesetzt werden, darunter:
- Online-Bewertung der Ernte auf dem Feld zur Optimierung der Maschinensteuerung bei der Ernte von Zuckerrüben, Mais, Weizen, Soja, Gerste, Raps, usw.
- Online-Erfassung des Verhaltens von Tieren im Stall im Hinblick auf das Tierwohl.
- Bewertung von Pflanzen und Tieren beim Eintritt in die verarbeitenden Fabriken, insbesondere im Hinblick auf das Tierwohl, vor allem bei Geflügel.
- In der Produktion bei Sortier- und Bewertungsprozessen.
- In der Verpackung, bspw. die Erkennung von Kunststoff-Fremdkörpern und die Überwachung der Produktqualität.
Beispiel: Bestimmung de Gewichtsanteile bei Masthühnern
Die präzise Messung des Gewichts von Brustfilets, Schenkeln, Flügeln und des Gesamtkörpers am Anfang der Schlachtlinie ermöglicht die Optimierung der Produktionssteuerung. Hierbei werden von jedem Huhn (bis zu 18.000 Hühner pro Stunde) hochauflösende 3D-Aufnahmen sowohl von vorne als auch von hinten erstellt, um aus den dadurch erhaltenen Volumendaten korrekte Gewichtsdaten abzuleiten. Diese Daten werden u. a. mithilfe von DL präzise verarbeitet. Dieser Prozess funktioniert selbst über verschiedene Hühnerrassen hinweg.
Beispiel Zuckerrübenbewertung
Die genaue Bewertung der geernteten Zuckerrüben ist entscheidend für die wirtschaftliche Analyse. Dabei werden verschiedene Faktoren geprüft:
- Blatt: Es sollten keine Blätter zusammen mit den Rüben geerntet werden. Aber wie viele Blätter sind trotzdem vorhanden?
- Erdanhang: Es sollte keine anhaftende Erde zusammen mit den Rüben geerntet werden. Aber wie viel Erde ist trotzdem an den Rüben haften geblieben?
- Bruch und Verletzung: Die Rüben sollten nicht gebrochen oder beschädigt sein, da beschädigte Rüben schneller verderben.
Diese Parameter können sowohl in der Zuckerfabrik als auch online auf dem Ernter ermittelt werden. Auf dem Ernter können die Informationen direkt zur Anpassung der Steuerung genutzt werden, um die Ernteergebnisse zu verbessern.
Beispiel Vacucheck
Käseblöcke werden in vakuumierten Schlauchbeuteln verpackt. Diese Verpackungen können undicht sein. Man erkennt dies daran, dass in einer dichten Verpackung die Folie auf der Oberfläche des Käses liegt und die Unebenheiten der Käseoberfläche sich in Form von Falten auf der Folie zeigen. Sobald Luft zwischen der Käseoberfläche und der Folie eingeschlossen ist, sind diese Falten weniger erkennbar. Durch spezielle Beleuchtungstechniken kann dieser Faltenwurf sichtbar gemacht werden, um eine genaue Analyse durchzuführen. Die herkömmliche Bildverarbeitung hat Schwierigkeiten bei der Interpretation dieses Faltenwurfs, aber Deep Learning (DL) bietet hier eine erhebliche Hilfe.
Fazit
Die Fortschritte im Bereich DL entwickeln sich rasant. In der Zukunft wird die Nutzung solcher Werkzeuge in vielen Anwendungen unverzichtbar sein. Es ist jedoch wichtig, die richtige Anwendung dieser Werkzeuge stets im Blick zu behalten. Einerseits entwickeln sich die DL-Ansätze schnell weiter und es benötigt Erfahrung, die geeigneten Methoden auszuwählen. Andererseits sind herkömmliche Werkzeuge der klassischen Bildverarbeitung für viele Aufgaben hervorragend geeignet und bewährt. Die Kombination von Ansätzen aus beiden Welten durch erfahrene Anwender führt zu den besten Erfolgsaussichten.
Autor: Dr. Carsten Cruse, Geschäftsführer, CLK Bildverarbeitung & Robotik