Künstliche Intelligenz
Machine Learning – so weit sind deutsche Unternehmen
Machine Learning - aus welchen Quellen kommen die Daten?
Erfolgsentscheidend für ML-Projekte ist die Frage, wie Unternehmen an die Daten für ihre Use Cases kommen. Der Umfrage zufolge bleiben die meisten ihren vorhandenen Quellen treu und entnehmen die Informationen etablierten ERP-Programmen, allen voran SAP-Systemen (siehe Grafik). Immerhin 42 Prozent greifen auch auf Produktionsdaten zurück, weitere 35 Prozent nutzen Maschinendaten als Quelle für ML-Verfahren. Bereits 31 Prozent beziehen IoT-Daten in ihre Projekte ein, aus Sicht der Studienautoren "ein klares Indiz für die digitale Evolution der Unternehmen in Deutschland".
Dass auch externe Datenquellen wichtig für ML-Vorhaben sind, zeigen die Antworten von 30 Prozent der Befragten. Dabei kann es sich beispielsweise um Wetterdaten handeln, die für etliche IoT-Anwendungsfälle benötigt werden. Unternehmen können diese mittels API von unterschiedlichen Anbietern im Pay-Per-Use-Modell beziehen und direkt in eigene Anwendungen integrieren. Wichtig sind vielen Entscheidern zudem "digitale Quellen", die etwa über Web-Browser, Apps oder auch Fitnesstracker generiert werden.
Hinzu kommen immer mehr öffentlich verfügbare Quellen zu Finanzdaten, öffentlichen Haushalten, Geodaten und wissenschaftlich erhobene Informationen. Rund 19 Prozent der Entscheider nutzen bereits öffentliche Datenquellen. Eigene Master-Data-Management-Systeme leisten sich hingegen nur 18 Prozent der Befragten, noch weniger setzen auf klassische Data-Warehouse-Systeme.
Welche Infrastruktur nutzen Unternehmen für Machine Learning?
In der praktischen Umsetzung müssen Unternehmen auch entscheiden, welche Infrastruktur sie für ihre ML-Initiativen nutzen. Mehr als die Hälfte der Befragten setzt auf die Rundum-sorglos-Pakete der großen Cloud-Anbieter in Form von Machine-Learning as a Service (siehe Grafik). Die Dienste werden über APIs meist relativ einfach zur Verfügung gestellt und lassen sich schnell in interne Softwareprojekte integrieren. Hinzu kommt der Vorteil, dass solche standardisierten Angebote in der Regel bereits auf eine hohe Skalierbarkeit getrimmt sind.
Immerhin 46 Prozent der Entscheider betreiben eine ML-Plattform on-premise. Nach Einschätzung von Crisp Research spiegelt sich darin auch die Stärke des deutschen Mittelstands wider. Eine produktions- und fertigungsnahe Analyse von Daten erfordere aufgrund der Latenz bei der Datenübertragung zum Teil immer noch eine On-Premises-Installation. Auch das Thema "Daten-Gravitation" könne dabei eine Rolle spielen, sprich: Dort, wo die Daten liegen, werden auch die Geschäfte abgewickelt. Entsprechend nah am Business sollten auch die Datenspeicher samt der Anwendungen untergebracht sein.