Maschinelles Lernen in der Produktion
Anwendungsgebiete und frei verfügbare Datensätze

Jonathan Krauß, Jonas Dorißen, Hendrik Mende, Maik Frye, Fraunhofer IPT und Robert H. Schmitt, WZL RWTH Aachen

Steigende Rechenleistungen und bessere Datengrundlagen bei gleichzeitig sinkenden Kosten für Rechen- und Speicherkapazitäten stellen die Basis für den Einsatz von Machine Learning (ML) in der Produktion dar. Herausforderungen bestehen in der Identifizierung aussichtsreicher Anwendungsgebiete, dem Erkennen der mit diesen verbundenen Learning Tasks sowie dem Aufdecken passender Datensätze. In diesem Beitrag werden daher folgende Fragen beantwortet: Welche Anwendungsgebiete in der Produktion bieten das größte Potenzial für den Einsatz von ML? Welche frei zugänglichen Datensätze eignen sich, um eigene Erfahrungen zu sammeln und welche Learning Tasks sind damit verbunden? Was sind Best Practices für die Anwendungsgebiete?

Haupttreiber für den wirtschaftlichen Aufstieg von Hochtechnologieländern stellt die Produktion dar [1]. Die Rolle, welche die Produktion in diesen Ländern spielt, befindet sich im Wandel: Innovation und Produktivität haben eine größere Bedeutung als Wachstum [2]. Im Kontext der vierten Industriellen Revolution steigt der Grad der Digitalisierung und Vernetzung in der Produktion. Die so wachsende Datengrundlage bei gleichzeitiger Kostenreduktion von Rechen- und Speicherkapazität führt dazu, dass Verfahren des maschinellen Lernens („Machine Learning“ oder kurz ML) vermehrt in der Produktion Anwendung finden. Der Einfluss, den ML und künstliche Intelligenz (KI) auf die Produktion haben, wird voraussichtlich weiter steigen. Da sich Forschung und Anwendung in diesem Bereich im starken Wandel befinden, fällt es schwer die aussichtsreichsten Anwendungsgebiete von ML zu identifizieren. Im Rahmen dieser Veröffentlichung wird aufbauend auf einer ausführlichen Literaturrecherche eine Übersicht gegeben, in welchen Anwendungsgebieten der Produktion der Einsatz von ML aussichtsreich ist. 


Voraussetzungen für den Einsatz von ML 

Die wichtigste Voraussetzung für den Einsatz von ML stellt eine ausreichende Datengrundlage dar. Zwar lassen sich über Plattformen wie kaggle, ucirvine, nasa oder openml Datensätze beziehen – eine strukturierte Übersicht der verfügbaren Datensätze bezogen auf die Anwendungsgebiete in der Produktion existiert allerdings nicht. 

Daher werden in diesem Beitrag frei verfügbare Datensätze vorgestellt und mit den zuvor dargestellten Anwendungsgebieten in der Produktion verbunden. Abschließend werden Empfehlungen für den Einsatz von ML in der Produktion gegeben. 

Anwendungsgebiete für ML in der Produktion 

Die Entscheidung ML in der Produktion anzuwenden wird aus unterschiedlichsten Gründen und von unterschiedlichsten Verantwortlichen getroffen. In manchen Fällen ist es der Prozessverantwortliche, der ein konkretes Problem lösen möchte, in anderen die Managementebene, die den Einsatz von ML erproben möchte. Grundlage für den Einsatz von ML in der Produktion stellt in jedem Fall die Wahl des richtigen Anwendungsgebiets im Unternehmen dar. Existierende Studien, die einen Überblick über mögliche Anwendungsgebiete aufzeigen, betrachten häufig nur Teilaspekte moderner Produktionsstätten. Eine hohe Abstraktionsebene oder mangelnde Aktualität führen dazu, dass sich diese Studien nur eingeschränkt zur Identifizierung der unternehmenseigenen Problemstellungen eignen [3-14].

Um den Verantwortlichen in der Produktion eine Grundlage für die Auswahl bereitzustellen, wurden am Fraunhofer IPT die in Bild 1 dargestellten Anwendungsgebiete identifiziert. Diese basieren auf einer ausführlichen Literaturrecherche und den Erfahrungen, welche am Fraunhofer IPT in Industrie- und Forschungsprojekten gesammelt wurden. Hier wurde die Bilanzhülle um die wertschöpfenden Prozesse innerhalb der Produktion gelegt - beginnend bei der Produktionsplanung bis hin zur Endkontrolle des Produkts. Anhand der Übersicht lassen sich neue ML-Projekte identifizieren und Ansatzpunkte für die Datensammlung in der Produktion finden. 

Die ML-Anwendungsgebiete lassen sich in drei Cluster einteilen: Prozess, Maschinen & Anlagen sowie Produkt. Das Cluster Maschinen & Anlagen besteht beispielsweise aus den Anwendungsgebieten Anomaly Detection, Predictive Maintenance (PdM) und Self-Learning Machines. Zu jedem Anwendungsgebiet sind eine Erklärung sowie Verweise auf Quellen aufgeführt, in denen das Anwendungsgebiet ebenfalls als hochwertig eingeschätzt wird.

Bild 1: Übersicht der Anwendungsgebiete Prozess, Maschinen & Anlagen
und Produkt. Hierunter sind Anwendungsgebiete in der Produktion
verortet und mit Anwendungen umschrieben [4-6, 8-12, 14]

Steht ein Unternehmen nun vor der Entscheidung ein ML-Projekt in der Produktion auszuwählen, gibt es zwei unterschiedliche Herangehensweisen: In einem Top-Down-Ansatz kann zunächst der generelle Bezug der Daten analysiert und das Anwendungsgebiet ausgewählt werden. Liegen viele prozessbezogene Daten vor, kann das Anwendungsgebiet Prozess ausgewählt werden. Werden Prozessdaten zur Qualitätsüberwachung und –kontrolle aufgezeichnet, kann das Anwendungsgebiet Predictive Process Control und eine entsprechende konkrete Problemstellung identifiziert werden. In der zweiten Herangehensweise, mit einem Bottom-Up-Ansatz, wird das Anwendungsgebiet anhand der Problemstellung identifiziert. Hier ist es sinnvoll zunächst die Problemstellung zu formulieren, dessen Lösung einen Mehrwert für die wertschöpfenden Prozesse im Unternehmen darstellt. Anschließend erfolgt eine Prüfung der entsprechenden Datengrundlage, inwiefern diese für den Einsatz von ML ausreichend ist und mit welchem Aufwand die Datenvor- und -aufbereitung verbunden ist. Der Aufwand variiert je nachdem ob die Datengrundlage fehlerhaft, bias-behaftete oder unstrukturierte Daten enthält und ist individuell vom jeweiligen Datensatz abhängig. 

Eine Einschätzung, ob die Datengrundlage ausreichend ist, muss in beiden Fällen getroffen werden. Dies ist möglich, wenn die beteiligten Mitarbeiter bereits Erfahrungen beim Einsatz von ML mit konkreten Datensätzen gesammelt haben. 

Zum Weiterlesen klicken Sie hier