Der Einsatz von Künstlicher Intelligenz (KI) erhält immer mehr Einzug in unserem Alltag. Für viele Unternehmen sind mit dem Einsatz aber auch noch Fragen und Unsicherheiten verbunden, beispielsweise im Hinblick auf das geeignete Vorgehen für eine effiziente Umsetzung von KI-Anwendungen. Welche Rolle spielt dabei automatisches maschinelles Lernen (Automated Machine Learning, AutoML)? Was kann mit AutoML automatisiert werden, wem hilft es und was sind Vor- und Nachteile beim Einsatz? Jessica Hofmann, Wissenschaftliche Mitarbeiterin am Zentrum für Sonnenenergie- und Wasserstoff-Forschung Baden-Württemberg (ZSW) hat in ihrem Vortrag im Rahmen des Online-Seminars „KI für KMU“, veranstaltet von der Wirtschaftsförderung Region Stuttgart GmbH, Antworten und Tipps auf diese Fragestellungen gegeben.
Definition von AutoML und ein systematischer Ablauf bei der Automatisierung von Aufgaben
Kleinere und mittlere Unternehmen (KMU) können mit AutoML-Technologien schnell und effizient KI-Anwendungen umsetzen. Durch AutoML wird das maschinelle Lernen vereinfacht, „indem verschiedene Teile des Prozesses automatisiert werden“ (Hofmann, ZSW, 2024). Dabei können sowohl einzelne Schritte als auch der gesamte Machine Learning Prozess automatisiert werden, je nach Komplexität und dem Umfang des Modells. Um ein einsatzfähiges und optimiertes Modell zu trainieren, sind jedoch zunächst gesammelte, strukturierte und ausgewählte Daten vonnöten. Liegen diese Daten vor, werden i.d.R. folgende Machine Learning Prozessschritte durchlaufen:
- Datenvorverarbeitung
- Modell-Selektion
- Modell-Training + Optimierung
- Modell-Bewertung
Im Folgenden sollen diese Schritte nun noch einmal genauer dargestellt werden. Zudem wurde im Vortrag eingeordnet, welches Wissen für welchen Schritt erforderlich ist. Auch darauf wird im Folgenden eingegangen.
Für die Datenvorverarbeitung sind eine Daten-Bereinigung, Feature-Engineering und die Aufteilung in Trainings- und Validierungsdaten notwendig. Das erfordert insbesondere gute Kenntnisse in der Datenverarbeitung und ein großes Domänen-Wissen. KI-Wissen ist in diesem Schritt nur bedingt erforderlich, da das Verständnis und die Strukturierung der Daten im Fokus liegen.
In einem nächsten Schritt erfolgt die Modell-Selektion. Die Modell-Auswahl sollte dabei anhand des Lern- und Problemtyps (z. B. Regression, Klassifikation, etc.) getroffen werden. Des Weiteren wird die Modell-Auswahl anhand der Dateneigenschaften und anhand der Problemkomplexität getroffen. Dieser Schritt erfordert ein gewisses Domänen-Wissen und insbesondere ein sehr großes KI-Wissen.
Für das Modell-Training und dessen Optimierung sind anschließend die Auswahl der Modell-Hyperparameter, die Auswahl der Fehlerfunktion und die Auswertung der Modell-Qualität notwendig. Auch hierfür ist ein großes KI-Wissen unerlässlich, um in einem iterativen Prozess zum optimalen Modell zu kommen.
In einem letzten Schritt erfolgt anschließend die Modell-Bewertung. Hierfür ist eine Auswahl der Bewertungskenngrößen, die Erstellung von Auswertungsplots und die Erstellung einer finalen Bewertung notwendig. Hilfreich sind hierfür wieder Domänenwissen, da die Qualität des Modells im Kontext der Problemstellung beurteilt werden muss. Auch ein gewisser Grad an KI-Wissen ist notwendig, für die Interpretation der Bewertungskenngrößen.
Der Fokus bei der Automatisierung der Anwendung des Maschinellen Lernens liegt dabei auf den Schritten der Modell-Selektion und des Modell-Trainings sowie dessen Optimierung, da diese Schritte vollständig automatisierbar sind. Sowohl die Modell-Suche als auch die Hyperparameter-Optimierung werden dabei durch Algorithmen durchgeführt. Die Datenvorverarbeitung und die Modell-Bewertung hingegen werden meist nur partiell automatisiert. Demnach können insbesondere die Aufgaben automatisiert werden, die wenig/kein Domänen-Wissen erfordern.
Im Hinblick auf den Nutzen von AutoML wird dabei deutlich, dass hiervon insbesondere zwei Personengruppen profitieren:
- Personen mit Domänen-Expertise und mit wenig KI-Wissen: Sie kennen zwar die Daten und die Problemstellung und sind an einer optimalen Lösung (KI-Modell) interessiert, müssen aber nicht den Lösungsprozess verstehen.
- Data-Scientists: Sie wollen zeitaufwendige Teile ihrer Arbeit automatisieren, nutzen AutoML als Unterstützung bei der Lösungsfindung für neuartige Problemstellungen und ziehen neue Erkenntnisse aus AutoML-Ergebnissen.
Für die KMUs bedeutet dies, dass Stunden teurer Fachkräfte bzw. der Aufbau tiefgehender KI-Expertise deutlich reduziert werden können, Kosten reduziert und ein schnelles Return of Invest erreicht werden kann.
Vor- und Nachteile von AutoML
Zusammenfassend sollen nun noch einmal die Vor- und Nachteile von AutoML dargestellt werden:
- Vorteile: Niederschwelliger Einstieg in KI-Anwendungen; leichte Nutzbarkeit; Automatisierung von Workflows mit hohen KI-Expertisen Anwendungen; passgenaue KI-Modelle durch Optimierungsalgorithmen für viele Problemstellungen; Skalierbarkeit des Machine-Learning-Prozesses; Zeit- und Kosten-Ersparnis
- Nachteile: Vergleichsweise neues Konzept / Forschungsgebiet; Hyperparameter Optimierung (HPO) ist deutlich verbreiteter, wird aber nicht immer mit AutoML assoziiert; nicht für riesige Modelltypen wie ChatGPT, Stable Diffusion, etc. geeignet; Nachvollziehbarkeit ist schwierig (hier gibt es jedoch Schritte hin zu Explainable AutoML); Anzahl des Trainings ist höher als bei manueller Herangehensweise, was KI-Energiekosten und den CO2-Fußabdruck erhöht (hier gibt es jedoch Schritte hin zu Green AI / Green AutoML)
Unterstützungsangebote durch das ZSW und deren Plattform KIlab.EE
Du möchtest mehr über die Anwendungsmöglichkeiten von AutoML und die Auswahl des richtigen Tools wissen? Dann kannst du dich an die Mitarbeiter:innen des Zentrums für Sonnenenergie- und Wasserstoff-Forschung Baden-Württemberg (ZSW) wenden, die im KI-Bereich seit über 25 Jahren aktiv sind. Außerdem sei an dieser Stelle auf die No-Code AutoML-Plattform KIlab.EE des ZSW verwiesen. Die Plattform läuft Open-Source und wurde für deutschsprachige KMU konzipiert, damit diese eigenständig KI-Anwendungen mit No-Code AutoML umsetzen können. Durch das Tool werden Anwender:innen dabei unterstützt, alle notwendigen Schritte zur Datenvorverarbeitung, zum Training und zur Evaluierung eines KI-Modells zu verstehen und anzuwenden. Es eignet sich für tabellarische und Zeitreihen-Daten. Die Datenhaltung erfolgt dabei sicher – auf Servern des ZSW in Stuttgart.
Die Inhalte dieses Wissensbits stammen aus dem Vortrag „Schnelle Umsetzung von KI-Anwendungen für KMU mit AutoML“ von Jessica Hofmann, Wissenschaftliche Mitarbeiterin für Maschinelles Lernen beim Zentrum für Sonnenenergie- und Wasserstoff-Forschung Baden-Württemberg (ZSW). Der Vortrag wurde im Rahmen des Online-Seminars „KI für KMU“ gehalten, welches die Wirtschaftsförderung Region Stuttgart GmbH am 30. Oktober 2024, im Rahmen des Kooperationsprojektes „Branchenzentriert qualifizieren – Zukunft sichern“, veranstaltet hat.
Branchenzentriert qualifizieren
Im Rahmen des Aufrufs „Branchenzentriert qualifizieren – Zukunft sichern“ wird durch das ESF-Plus Projekt „Branchen-Quali-Digital“ die IKT Branche in Baden-Württemberg durch branchenzentrierte Qualifizierung zukunftsfähig aufgestellt, damit sie Treiber von Innovation und gesamtwirtschaftlichem Wachstum in nahezu allen anderen Wirtschaftsbereichen bleibt.
Kofinanziert vom Ministerium für Wirtschaft, Arbeit und Tourismus Baden-Württemberg aus Mitteln des Europäischen Sozialfonds (ESF) und des Landes Baden-Württemberg.