Machine Learning
9 Mythen vom maschinellen Lernen
Mary Branscombe beschäftigt sich als freiberufliche Journalistin seit über 20 Jahren mit der IT-Branche. Sie schreibt unter anderem für unsere US-Schwesterpublikation cio.com.
Florian Maier beschäftigt sich mit diversen Themen rund um Technologie und Management.
Maschinelles Lernen erweist sich als ziemlich nützlich. Deswegen ist die Versuchung groß, anzunehmen, dass Machine LearningMachine Learning (ML) im Stande ist, einfach jede Problemstellung zufriedenstellend zu lösen. Wie das bei technologischen Werkzeugen nun mal so ist, ist aber auch maschinelles Lernen nur in bestimmten Aufgabengebieten zur Lösungsfindung geeignet. Im Regelfall sind das genau die Probleme, die schon ewig bestehen, für die Sie aber nie genug Leute einstellen konnten. Oder solche, die zwar eine klare Zielsetzung aufweisen, bis jetzt aber einen Lösungsweg vermissen lassen. Alles zu Machine Learning auf CIO.de
Dennoch ist es wahrscheinlich, dass so gute wie jedes Unternehmen in Zukunft Vorteile aus dem Einsatz von Machine Learning ziehen will: In einer Umfrage von Accenture zeigten sich 42 Prozent der befragten IT-Entscheider davon überzeugt, dass bis zum Jahr 2021 jede ihrer Innovationen KI-getrieben sein wird.
Wenn auch Sie den Einsatz von maschinellem Lernen planen, sollten Sie über den Hype-Tellerrand hinausblicken und gängige Mythen meiden. Nur wenn Sie darüber Bescheid wissen, was Machine Learning kann und was nicht, können Sie bezüglich Ihrer ML-Bemühungen auch mit Erfolg rechnen.
"Machine Learning gleich Künstliche Intelligenz"
Machine Learning und Künstliche Intelligenz (KI) werden inzwischen quasi durchgängig synonym gebraucht. Allerdings bezeichnet ML die KI-Technik, die bislang am erfolgreichsten den Weg aus den Forschungslaboren in die echte Welt gefunden hat. Künstliche Intelligenz hingegen umfasst neben maschinellem Lernen auch noch ganz andere Forschungsgebiete wie Robotik, Computer Vision und Natural Language Procession.
Hüten Sie sich vor Buzzwords und seien Sie präzise: Bei Machine Learning geht es um Mustererkennung und Vorhersagen für große Datensets. Die Ergebnisse sehen vielleicht "intelligent" aus, haben aber nichts mit KI zu tun. Stattdessen geht es im Grunde darum, Statistiken in bisher nicht dagewesener Schnelligkeit und Skalierung anzuwenden.
"Alle Daten sind verwertbar"
Für maschinelles Lernen brauchen Sie Daten. Aber nicht alle Daten sind für Machine Learning auch brauchbar. Um Ihr ML-System "trainieren" zu können, brauchen Sie repräsentative Daten, die die Muster und Ergebnisse abbilden, mit denen es Ihr System zu tun bekommt. Die zur Verfügung stehenden Daten müssen also frei von irrelevanten Mustern sein, weil das System anderenfalls diese spezifischen Muster auch auf den Rest der Daten anwendet und diese dahingehend durchforstet.
Alle Daten, die Sie zum Trainieren eines Machine-Learning-Systems verwenden, müssen zudem ausreichend gekennzeichnet werden - und zwar mit den Features, die zu den Fragen passen, die Sie dem System anschließend stellen wollen. Das klingt nicht nur nach einer Menge Arbeit, sondern ist es auch. Dennoch sollten Sie nicht den Fehler begehen, davon auszugehen, dass Ihre Daten sauber, strukturiert, repräsentativ oder einfach zu kennzeichnen sind.
- Facebook-Gesichter
Computer können lernen, menschliche Gesichter zu unterscheiden. Facebook nutzt das für die automatische Gesichtserkennung. - Machine Learning
Anders als das Bild suggeriert ist Machine Learning ein Teilgebiet von Artificial Intelligence – allerdings ein sehr wichtiges. - AlphaGo
Maschine schlägt Mensch: 2016 besiegte Googles Machine Learning System AlphaGo den Weltmeister im Spiel Go. - Grafikprozessoren GPU Nvidia
Die führenden Companies im Machine Learning nutzen für die parallele Verarbeitung der Daten Grafikprozessoren (GPUs) - etwa von Nvidia. - Deep Learning
Deep Learning Verfahren lernen erst Low-Level Elemente wie Helligkeitswerte, dann Elemente auf mittlerer Ebene und schließlich High-Level Elemente wie ganze Gesichter. - IBM Watson
IBM Watson integriert mehrere Artificial Intelligence Methoden: Neben maschinellem Lernen sind das Algorithmen der natürlichen Sprachverarbeitung und des Information Retrieval, der Wissensrepräsentation und der automatischen Inferenz.
"Man braucht immer jede Menge Daten"
Díe kürzlich bei der Bild-, Text- und Kontexterkennung erzielten Fortschritte sind in erster Linie der Existenz neuer, besserer Tools und Hardware zu verdanken. Diese machen es nun möglich, riesige Datenmengen (parallel) zu verarbeiten.
Dank einer trickreichen Methode namens "transfer learning" brauchen Sie aber nicht immer notwendigerweise ein großes Datenset, um in einem speziellen Bereich gute Machine-Learning-Ergebnisse zu erzielen. Sattdessen bringen Sie Ihrem ML-System einmal bei, ein solches Datenset zu benutzen und transferieren diese Lernleistung anschließend auf ihr eigenes, kleineres Daten-Trainings-Set. So funktionieren auch die "custom vision"-APIs von Salesforce und MicrosoftMicrosoft Azure: Diese Systeme brauchen nur zwischen 30 und 50 Bildern, um zu lernen was klassifiziert werden soll. Alles zu Microsoft auf CIO.de
"Transfer learning" versetzt Sie also in die Lage, ein (trainiertes) System zum maschinellen Lernen auf Ihre ganz eigene Problemstellung auszurichten - mit einer vergleichsweise geringen Menge an Daten.