Expertenwissen nicht nötig

Tools für Machine Learning im Überblick

13.10.2015 von Werner Kurzlechner
Machine Learning-Algorithmen muss man laut Forrester nicht mehr selbst programmieren. Es gibt genügend Tools, die problemlos in Apps eingebettet werden können.
  • Forrester unterscheidet zwei grundsätzliche Herangehensweisen
  • Besonders hilfreich ist die Technologie in sich verändernden Szenarien
  • Big Data liefert den Treibstoff für die weitere Entwicklung
  • Entwickler können vom Wettrennen der Cloud-Riesen profitieren
In dieser Grafik skizziert Forrester, wie Machine Learning funktioniert.
Foto: Forrester Research

Auch IT-Analysten machen manchmal recht lustige Dinge. Mike Gualtieri von Forrester Research zum Beispiel sägt an Wassermelonen herum und schnippelt in einen Schutzanzug gehüllt Äpfel und Orangen. Er tut dies in einem Video-Blog-Eintrag, der die sechs zentralen Schritte zum Aufbau vorausschauender Modelle erläutert, die auf Machine Learning basieren. Das Video erinnert ein bisschen an die "Sendung mit der Maus" - und tatsächlich will Forrester den Anwendern vor allem die Scheu vor dem Thema nehmen. "Keine Angst", heißt es in einer Studie von Gualtieri und seinem Kollegen Rowan Curran. "Man braucht keinen Doktortitel in Computerwissenschaften, um Machine Learning in eigene Apps einzubauen."

Neue Daten machen Apps beständig schlauer

Anwendungsentwickler könnten demnach Apps viel smarter als bisher machen, in dem kontinuierlich das Nutzererlebnis eingespeist wird, Ergebnisse prognostiziert werden und beständig neue Erkenntnisse erhoben werden. Dafür müsse man gar nicht selbst Machine Learning-Algorithmen programmieren. Denn es gebe auf dem Markt Tools - sowohl kommerzielle als auch solche auf Open Source-Basis - für die Gestaltung von Modellen, die problemlos in Apps einbettet werden können.

"Früher war Machine Learning der Forschung und großen Unternehmen mit enormen Speicherkapazitäten und Processing-Budgets vorbehalten", heißt es in der Studie. "Heute profitieren die Anwender von einem großen Markt von kommerziellen Tool-Anbietern, Machine-Learning-Services und Open Source-Tools, die Zugang zu den Erkenntnissen ermöglichen."

Defintion von Machine Learning

Forrester definiert Machine Learning als Feld der Informatik, in dem neue Algorithmen entwickelt und ständig verbessert werden. Und zwar mit dem Ziel der automatischen Datenanalyse, um Muster zu identifizieren und Ergebnisse vorauszusagen. Es gebe dabei Dutzende spezieller Algorithmus-Arten, bis hin zur Analyse von Gesichtsausdrücken auf Fotos und in Videos.

Das Besondere dabei ist, dass mit der Analyse neuer Daten alles immer schlauer wird. Dazu ein Beispiel: Eine Kaufempfehlungs-Software, die Machine Learning nutzt, nimmt die Geschmacksvorlieben von "Game of Thrones"-Zuschauern unter die Lupe und identifiziert dabei wiederkehrende Muster. Sobald die Daten einer neuen Testperson hinzukommen, wird antizipiert, ob diese die Serie ebenfalls mag. Entpuppt sich die Vorhersage als falsch, wird der Machine Learning-Algorithmus mit der neuen Information gefüttert und auf diese Weise beständig angepasst.

Grundsätzlich zu unterscheiden sind nach Forrester zwei Ansätze:

Digitaler "Butler" antizipiert Kundenwünsche

Apps werden laut Studie durch Machine Learning in hohem Maße anpassungsfähig. Sie mutieren gleichsam zu einem "digitalen Butler", der den Kunden bei Bedarf dient und im Lauf der Zeit immer besser lernt, ihre Wünsche vorauszuahnen. Machine Learning-Apps müssen dafür User-Bedürfnisse antizipieren und auf veränderte Umstände reagieren können. "Machine Learning brilliert in Szenarien, in denen die bestmögliche Empfehlung, das ideale Verhalten oder das optimale Ergebnis sich wahrscheinlich verändern", so Gualtieri und Curran.

Die Analysten veranschaulichen das an einer Reihe von Use Cases. Machine Learning kann etwa Menüs und Monitor-Funktionalitäten an persönliches Verhalten anpassen. Man logt sich zum Beispiel in seine mobile Banking-App ein - und weil man dabei als erstes eine Überweisung zu tätigen pflegt, erscheint sogleich die dafür richtige Maske.

Höchst hilfreich können auch antizipierende Informationen sein, etwa bei der Betrugserkennung. Eine Fraud Identification-Apps kann via Machine Learning selbständig neue Datenebenen erkennen und die Compliance-Verantwortlichen über die neu auftauchenden Muster informieren.

Big Data: Neue Berufsbilder
Big Data: Neue Berufsbilder
In den teilweise euphorischen Einschätzungen von Markforschern und IT-Unternehmen ist immer wieder die Rede von neuen Berufsbildern, die Big Data mit sich bringen soll. Dazu zählen unter anderem folgende Tätigkeiten:
Data Scientist
Er legt fest, welche Analyseformen sich am besten dazu eignen, um die gewünschten Erkenntnisse zu erzielen und welche Rohdaten dafür erforderlich sind. Solche Fachleute benötigen solide Kenntnisse in Bereichen wie Statistik und Mathematik. Hinzu kommen Fachkenntnisse über die Branche, in der ein Unternehmen beziehungsweise tätig ist und über IT-Technologien wie Datenbanken, Netzwerktechniken, Programmierung und Business Intelligence-Applikationen. Ebenso gefordert sind Verhandlungsgeschick und emotionale Kompetenz, wenn es um die Zusammenarbeit mit anderen Abteilungen geht.
Data Artist oder Data Visualizer
Sie sind die "Künstler" unter den Big-Data-Experten. Ihre Hauptaufgabe besteht darin, die Auswertungen so zu präsentieren, dass sie für Business-Verantwortliche verständlich sind. Die Fachleute setzen zu diesem Zweck Daten in Grafiken und Diagramme um.
Data Architect
Sie erstellen Datenmodelle und legen fest, wann welche Analyse-Tools Verwendung finden und welche Datenquellen genutzt werden sollen. Auch sie benötigen ein umfassendes Know-how auf Gebieten wie Datenbanken, Datenanalyse und Business Intelligence.
Daten-Ingenieur
Diese Aufgabe ist stark auf die IT-Infrastruktur ausgerichtet. Der Dateningenieur ist das Big-Data-Analysesystem zuständig, also die Hard- und Software sowie Netzwerkkomponenten, die für das Sammeln und Auswerten von Daten benötigt werden. Eine vergleichbare Funktion haben System- und Netzwerkverwalter im IT-Bereich.
Information Broker
Er kann mehrere Rollen spielen, etwa die eines Datenhändlers, der Kunden Informationen zur Verfügung stellt, oder die eines Inhouse-Experten, der Datenbestände von unterschiedlichen Quellen innerhalb und außerhalb des Unternehmens beschafft. Außerdem soll er Ideen entwickeln, wie sich diese Daten nutzbringend verwenden lassen.
Data Change Agents
Diese Fachleute haben eine eher "politische" Funktion. Sie sollen bestehende Prozesse im Unternehmen analysieren und anpassen, sodass sie mit Big-Data-Initiativen kompatibel sind. Nur dann lässt sich aus solchen Projekten der größtmögliche Nutzen ziehen. Wichtig sind daher ausgeprägte Kommunikationsfähigkeiten, Verständnis für Unternehmensprozesse sowie Kenntnisse im Bereich Qualitätssicherung und Qualitätsmanagement (Six Sigma, ISO 9000).

Anbieter und Marktplätze für Machine Learning

Die meisten Anwendungsentwickler seien keine Machine Learning-Experten, so Forrester. Deshalb helfe den Anwendern der Software-Markt weiter. So seien entsprechende Funktionen in die besten Analyse-Tools für Unternehmen eingebaut. In alphabetischer Reihenfolge nennen die Analysten hier diese Anbieter: Alpine Data Labs, Alteryx, Angoss Software, Dell, FICO, IBM, KNIME.com, Microsoft, Oracle, Predixion Software, RapidMiner, SAP und SAS. Spezielle Tools würden auch von DataRobot, H2O, Skytree und anderen angeboten.

"Die Open Source-Community ist eine reichhaltige Quelle an Informationen und Forschungen über Machine Learning-Algorithmen und -Bibliotheken", heißt es weiter in der Studie. Unter anderem beinhalte die Open Source-Programmiersprache für Statistik R Implementierungen für Machine Learning-Algorithmen. Darüber hinaus bieten laut Forrester auch die großen Cloud-Anbieter Amazon, Google und Microsoft auf ihren Plattformen entsprechende Funktionen an. Analytics-Marktplätze in der Cloud, auf denen Entwickler Algorithmen anbieten und einkaufen können, gibt es ebenfalls bei diesen Platzhirschen, aber auch bei kleineren Startups wie etwa Algorithmia.

Hinzu kommen Angebot von Beratungshäusern und Paketanwendungen. Accenture, CI&T, Deloitte, Infosys, Mindtree und Virtusa haben Machine Learning laut Forrester in ihren großen Daten- und Analyseangeboten mit drin. Ferne gebe es auf diesem Markt spezialisierte Anbieter wie Beyond The Arc, Fractal Analytics und Think Big, A Teradata Company.

"Der Krieg der Algorithmen hat begonnen"

Wer nach Data Science-Talenten für Machine Learning-Projekte suche, könne auf Websites wie Experfy.com oder Upwork.com fündig werden, so Forrester. "Ein anderer Ansatz ist es, seine Machine Learning-Aufgabe auf Kaggle.com oder Algorithmia zu posten", erläutern Gualtieri und Curran weiter. "Dort können Data Scientist an Ihrem Problem knobeln - in der Hoffnung auf den Gewinn des Preisgeldes, das Sie für die beste Lösung ausgelobt haben."

Data Scientists
Die Aufgaben des Business Developer
Business Developer blicken tief in die Geschäftsprozesse und können Unternehmensziele mit Datenanalysen in Verbindung bringen. Sie entwickeln eine erste Fragestellung oder decken ein Problem auf, das anhand der erhobenen Daten gelöst werden soll. Als Schnittstelle zwischen Geschäftswelt und Technik kann er den Nutzen der Analyseergebnisse am besten einschätzen und arbeitet daher eng mit dem Data Analyst zusammen.
Die Aufgaben des Data Analyst
Der Data Analyst besitzt profunde Kenntnis über datengetriebene analytische Methoden, Data Mining-Verfahren und Techniken der Datenvisualisierung. Mit ihnen können Datensätze automatisch klassifiziert oder hinsichtlich ihrer Ähnlichkeit gruppiert werden. So kann der Data Analyst die Aussagekraft der Daten bewerten und relevante Muster und Auffälligkeiten in den Datenströmen erkennen.
Die Aufgaben des Data Manager
Der Data Manager sorgt dafür, dass die Qualität der Daten optimiert wird und sie durch Metadaten ausreichend beschrieben werden. Dazu zählt, dass sich der Data Manager einen Überblick über die Nutzungsrechte verschafft und bei sensiblen Daten weiß, wofür diese verwendet werden dürfen.
Die Aufgaben des Application Developer
Der Application Developer setzt die Plattform auf, auf der die Daten integriert und die Anwendungen entwickelt und installiert werden. Er beherrscht verschiedene Werkzeuge zur Parallelisierung und Echtzeitverarbeitung, so dass die statistischen Modelle des Data Analysten auch auf großen Datenmengen genutzt werden können.
Die Aufgaben des Security Manager
Der Security Manager sorgt dafür, dass die Zusammenführung, Anreicherung und Analyse von Daten keine Rückschlüsse auf Einzelpersonen zulässt und damit die Persönlichkeitsrechte verletzen könnte. Der Security Manager muss also den Datenschutz organisatorisch und technisch umsetzen.
Die 5 Typen von Data Scientists im Überblick
Das Schaubild zeigt noch einmal alle 5 Typen von Data Scientists und ihre Aufgaben im Überblick.

"Der Krieg der Algorithmen hat begonnen", konstatiert Forrester. Der Einsatz von Machine Learning-Apps werde sich zu einem Schlüsselfaktor im Kampf um die Gunst der Kunden entwickeln. Faktoren für die zu erwartenden schnellen Fortschritte in diesem Feld seien neben vertieften akademischen Forschungen auch Big Data als Treibstoff - schließlich sind es Daten, mit denen lernende Algorithmen gefüttert werden - und das harte Wettrennen der Internetgiganten um die besten Algorithmen.

Als normalsterblicher Entwickler werde man an das Herrschaftswissen von Google, Amazon und Co. zwar nicht herankommen. Sehr wohl könne man sich von den entstehenden Apps aber inspirieren lassen und Ideen aus ihnen ziehen. Die Nutzung werde zudem durch den wachsenden Austausch von Algorithmen etwa auf dem Azure Marketplace von Microsoft beschleunigt.

Diese Zusammenhänge werden genauer erläutert in der Forrester-Studie "A Machine Learning Primer For BT Professionals". Wie man Prognose-Modelle auf Machine Learning-Basis erstellt, demonstriert Mike Gualtieri in sechs Schritten in seinem Blog. Wer mit zerstückeltem Obst fühlt, sollte es sich nicht ansehen.