Vermutlich hat jeder schon mal was von Machine Learning gehört, jedoch nur die wenigsten wissen, was eigentlich dahintersteckt, was schon heute passiert und was in naher Zukunft möglich sein wird. Ein grundsätzliches Wissen über Verfahren des maschinellen Lernens ist unabdingbar, denn diese bestimmen bereits heute unser Leben maßgeblich. Wer die „Denkweise“ der autonomen Systeme nicht mehr nachvollziehen kann, wird auch unsere Gesellschaft weniger verstehen können – und vermutlich den von Stephen Hawking prophezeiten möglichen Untergang der Menschheit nicht aufhalten.
Machine Learning verändert die Welt
Gegenwärtig überschlagen sich Tech-Blogs, Wirtschaftsnachrichten und Karriereportale mit Vorhersagen, wie viele Jobs die Digitalisierung überflüssig machen wird. Dabei ist es gar nicht der Prozess der Digitalisierung bzw. Vernetzung, sondern der Einsatz künstlicher Intelligenz, der unsere Gesellschaft einen Wandel, insbesondere in der Berufswelt, bescheren wird.
Künstliche Intelligenzen steuern Gebäude, Fahrzeuge (Autos, Busse, Drohnen usw.) und Handelssysteme. Sie werden in der Zukunft unseren Einkauf und die Warenlieferung übernehmen, unsere Autos fahren, unsere Buchhaltung erledigen, unser Geld optimal auf den Finanzmärkten anlegen und unsere Krankheiten frühzeitig diagnostizieren und die bestmögliche medizinische Behandlung vorgeben.
Spätestens dann werden künstliche Intelligenzen eine Macht über uns ausüben, die unser alltägliches Leben betrifft. Diese Macht beginnt recht harmlos, beispielsweise indem schon heute Algorithmen darüber mitbestimmen, welche Musik wir hören und welche Filme wir sehen. Online-Shops, aber auch solche von Banken und Versicherungen, nutzen vermehrt Machine Learning, um ihre Webseiten dynamisch nach kundenindividuellen Aspekten zu gestalten. Effektive Online-Shops differenzieren längst nach individuellen Besuchervorlieben.
Beispielsweise benötigen weibliche Singles andere Waren- und Dienstleistungen als männliche Singles, verheiratete Paare, Eltern oder auch Senioren. Besonders mächtige Unternehmen, allen voran Google, könnten darüber bestimmen, welche Informationen wir erhalten – und welche uns vorenthalten werden, weil sie inhaltlich wahrscheinlich nationale Gesetze verletzen oder uns womöglich ganz einfach nicht interessieren. Klingt sinnvoll? Ja, aber das „wahrscheinlich“ und „wonöglich“ reicht für ein autonomes Systeme bereits aus, um für uns Entscheidungen zu treffen.
Machine Learning: Arbeit mit Wahrscheinlichkeiten
Jeder Mensch weiß: wer lernt, der macht auch Fehler. Eigentlich sorgen erst Fehler für den Lerneffekt, so ist es auch beim maschinellen Lernen. Immer dann, wenn wir klare Regeln erkennen können und die Sicherheit ihrer Wirkung bestätigt haben, brauchen wir kein maschinelles Lernen mehr, sondern können diese Regeln fest einprogrammieren.
Ein Beispiel zur Verdeutlichung ist das autonom fahrende Auto. Man könnte versuchen einem Auto einfach nur wenige Regeln (im wahrsten Sinne des Wortes) mit auf dem Weg zu geben, beispielsweise:
- Fahre gerade aus
- kommt ein Hindernis und rechts ist frei: fahre nach rechts, dann wiederhole ab 1.
- kommt ein Hindernis und rechts ist nicht frei, aber links: fahre nach links, dann wiederhole ab 1.
- kommt ein Hindernis und weder rechts noch links ist frei, fahre ein Stück zurück, dann wiederhole ab 2.
Schon mit diesem einfachen einprogrammierbaren Regelwerk könnte ein Auto auf einem abgesperrten Testgelände fahren und so, von außen betrachtet, den Anschein einer gewissen Intelligenz erwecken. Viele der früheren Ansätze der künstlichen Intelligenz waren in Wirklichkeit keine, sondern simulierten ihre Intelligenz durch fest einprogrammierte Regeln.
Algorithmen: Der Realität gerecht werden
Die detaillierten Regeln für den echten Straßenverkehr wären jedoch unbeherrschbar in ihrer Anzahl und Komplexität, und überhaupt, was ist eigentlich ein Hindernis und wie ist auf ein solches zu reagieren? Längst bevor es autonome Autos gab, lernten Autos der höheren Preiskategorie bereits, via Kamerasystemen Hindernisse hinsichtlich ihrer Gefährlichkeit zu beurteilen und Verkehrszeichen zu „lesen“. In der Praxis sind Verkehrszeichen zerkratzt, die Farbe blättert teilweise ab, es könnte nass sein und Sonnenlicht reflektieren, vielleicht ist es auch mit Aufklebern gespickt und leicht verdreht, so dass der Aufnahmewinkel des im Auto integrierten Kamerasystems es in einem schlechten Winkel erfasst, aber dennoch muss das Verkehrszeichen zuverlässig korrekt erkannt werden – ein festes Einprogrammieren von Regeln würde daher niemals ausreichen.
Genau deswegen wird heute kein Algorithmus mehr entwickelt, der genau ein Verkehrszeichen unter Idealverhältnissen erkennt, sondern Algorithmen, die Verkehrszeichen aus den unendlich vielen Darstellungskonditionen heraus zuverlässig erkennen kann. Der Algorithmus wird dafür mit praxisnahen Tests trainiert und von den Entwicklern solange optimiert, bis das Ergebnis stimmt – sogenanntes überwachtes Lernen (Supervised Learning).
Der Algorithmus der Verkehrsschild-Erkennung via Videobild funktioniert über neuronale Netzwerke und arbeitet – vereinfacht gesagt – dabei so, dass die Bildpixel betrachtet und einzelne Algorithmen jeweils Einzelfragen (Dimensionen) in Prozent beantworten und diese zu einem Gesamtergebnis (einer „Prediction“) zusammengefasst werden. Beispielsweise könnte ein Kamerabild ein Verkehrsschild zeigen, dessen Form zu 98%, Farbmuster zu 78% und Kontrastmuster zu 99% dem Stopp-Schild entspricht und daher (unter Berücksichtigung von Gewichtungen der Einzelergebnisse) als Gesamtergebnis mit 96% eindeutig als Stopp-Schild erkannt wird. Wird das Stopp-Schild nicht zuverlässig erkannt, muss an den einzelnen Algorithmen gefeilt oder die einzelnen Gewichtungen optimiert werden.
In der Praxis arbeiten neuronale Netze allerdings nicht mit nur drei, sondern mit hunderten oder gar tausenden Dimensionen, wie beispielsweise Nico Hezel im Data Science Blog erklärt.
Überwachtes Lernen: Lebensoptimierer und Informationsfilter
Supervised Machine Learning kann nicht nur das zukunftsnahe autonome Fahren ermöglichen, sondern hilft uns schon jetzt im Alltag, z. B. als Spam-Filter. Die Spam-Filter von Google und Microsoft sind in den letzten Jahren so gut geworden, dass die früher viel diskutierten False-Positives (also fälschlicherweise als Spam markierte Mails) bereits sehr selten geworden sind. Auch Spam-Filter hatten ihren Anfang in einfachen „wenn das Wort xyz enthalten ist, dann Spam“-Logiken.
Ausgereifte Algorithmen und die enorme Datenbasis ermöglicht dem Spam-Filter jede einzelne Mail nach einer komplizierten Analyse als Spam oder Nicht-Spam zu klassifizieren, denn Vergleichsdaten gibt es ja genug – und laufend werden neue Mails von menschlichen Lesern als Spam oder Nicht-Spam markiert. Die künstliche Intelligenz erhält – vom Menschen überwacht – also laufend neue Indizien zur korrekten Spam-Erkennung.
Unüberwachtes Lernen: Künstliche Intelligenz bringt neue Erkenntnisse
Das unüberwachte maschinelle Lernen (Unsupervised Learning) ist das Geheimrezept für Big Data Analytics. Die angestrebte autonom arbeitende Fabrik nach dem Prinzip der Industrie 4.0 und andere verteilte Systeme (Stichwort „Internet of Things“) produzieren pro Minute mehrere Terabyte an Daten und sind in ihren Strukturen derart unterschiedlich, dass ein Mensch diese nicht mehr überblicken kann.
Bestimmte Algorithmen, meistens aus dem Bereich der Clusteranalyse, tun nichts anderes als – fast gänzlich ohne Zielvorgabe durch den Menschen – alle diese Daten im Kontext zu betrachten und Gleichheit bzw. Unterschiedlichkeit zu ermitteln. Die Maschine ermittelt also alle relevanten Merkmale in übergroßen Datenmengen und wird so zum Entdecker, beispielsweise in der Gentechnik oder Geologie. Aber auch Faktoren für Ausfälle von Maschinen wie Produktionsanlagen oder Fahrstühlen werden überwacht und aufgedeckt.
Deep Learning: die gerichtete Intelligenz
Die zuvor erwähnten künstlichen neuronalen Netze haben das Potenzial, Intelligenzen zu erschaffen, die dem menschlichen Gehirn absolut überlegen sind, allerdings nur für eine ganz bestimmte Aufgabe. Die menschliche Intelligenz umfasst nicht nur das Verständnis von Mathematik, sondern auch von menschlicher Sprache und Kultur, visueller Kreativität und vielem mehr. Das durchschnittliche menschliche Gehirn ist also eher ein Allrounder statt ein Spezialist. Zum Spezialisten können wir allerdings unsere Maschinen machen.
Aufsehen erregte Google vor kurzem mit seiner künstlichen Intelligenz namens AlphaGo, hinter der sich Algorithmen verstecken, die den Weltmeister im Go-Spiel in vier von fünf Spielen besiegt hatte. Das Spiel Go entstand vor mehr als 2.500 Jahren in China und ist auch heute noch in China und anderen asiatischen Ländern ein alltägliches Gesellschaftsspiel. Es wird teilweise mit dem westlichen Schach verglichen, hat jedoch einfachere Regeln, aber auch ein deutlich größeres Spielfeld, das kein Match in wenigen Zügen erlaubt.
Da unser menschliches Gehirn nicht für exponentielle Mathematik gemacht ist, unterschätzen fast alle Menschen die Anzahl aller möglichen Aufstellungen des Spiels: Es sollen mehr sein, als es Atome im Universum gibt! Mit einer derartigen Komplexität kam bisher nur das menschliche Gehirn klar, aber speziell darauf abgerichtete Algorithmen können und werden – wie dieser Wettbewerb zwischen Mensch und Maschine zeigt – gegenüber dem menschlichen Denkvermögen überlegen sein.