Splunk sammelt und indiziert Log- und Maschinendaten aus beliebigen Quellen, analysiert und visualisiert sie und hilft so, bessere Entscheidungen zu treffen. Der Hersteller spricht von "Operational Intelligence" und setzt unter anderem auf die Bereiche IT-Betrieb, IT-Sicherheit und Business Analytics als Einsatzfelder. Die Daten werden wahlweise in lokalen, in Cloud-basierten oder in hybriden Umgebungen gesammelt, verknüpft und auswertbar gemacht.
Wie das beim Car-Sharing-Dienst DriveNow geschieht, beschrieb Eduard Saller, Data Scientist bei der DriveNow-Mutter BMW Group. Das Kernproblem beim Carsharing: Die Fahrzeuge befinden sich oft nicht dort, wo ein Kunde gerade Bedarf hat. Unternehmen wie DriveNow müssen also Wege finden, um ihre Flotte so zu platzieren, dass die Auslastung optimal ist. Je intensiver ein Fahrzeug genutzt wird, desto höher die Rentabilität. Die Datenexperten von BMW haben sich deshalb vorgenommen, Kennzahlen zu beschaffen, um eine optimale Nutzung zu erreichen und teure Standzeiten zu verkürzen. Die Idee ist laut Saller bei einem betriebsinternen Hackathon entstanden.
Telemetriedaten als Basis
Im ersten Schritt entschied sich das Team, die Telemetriedaten - die Maschinendaten, die von den Autos selbst gesendet werden - zu monitoren. Dazu gehören insbesondere die via GPS ermittelten Positionsdaten eines Fahrzeugs, wenn es gebucht und wieder abgestellt wird, sowie eine "ganze Reihe weiterer Metadaten", wie Saller vor den rund 500 Besuchern der Splunk-Konferenz ausführte. "Wenn man nicht genug Daten gesammelt hat, kann man auch keine Machine-Learning-Ansätze verfolgen, weil einem die Masse fehlt", stellte Saller klar.
Das BMW-Team hat eine Anwendung entwickelt, die direkt auf der Splunk-Datenbank läuft und es erlaubt, Vorhersagen über den Bedarf der Fahrzeuge zu treffen. Neben den Fahrzeugdaten sollen künftig noch andere Quellen angezapft werden: Wetterdaten etwa helfen, jahreszeitliche Abweichungen einzukalkulieren, aber auch kurzfristig auf Hitzewellen und Regenperioden zu reagieren.
Event-Daten geben Aufschluss über bestimmte Peaks, wenn beispielsweise Fußballspiele oder Open-Air-Konzerte stattfinden. Auch Feiertage oder Ferienzeiten sollen einkalkuliert werden. In Großstädten gilt es zudem, die öffentlichen Verkehrsmittel zu berücksichtigen: Ist die Anbindung an den Personennahverkehr gut, sinkt der Bedarf an Carsharing-Autos.
Mit dem Machine-Learning-Toolkit von Splunk, das an die Datenbank des Herstellers angebunden ist, haben die BMW-Techniker ein Vorhersagemodell entwickelt, das sie nun trainieren können. Den Erhebungszeitraum, der für das Training herangezogen werden soll, legen die Datenspezialisten selbst fest. Wenn zum Beispiel eine überdurchschnittliche Hitzewelle auftritt, können die Trainingsdaten darauf abgestimmt werden, so dass nur die letzten zwei oder drei Wochen der Benutzung für die Vorhersage verwendet werden.
Wetter- und Event-Daten als Zugabe
Mit einem Live-Monitoring lässt sich der Zustand der Flotte permanent abbilden. Für den DriveNow-Case werden bislang nur die Maschinendaten der Fahrzeuge verwendet, keine Wetter-, Event- oder sonstigen Daten. Damit stützt sich die Analyse derzeit vor allem auf GPS-Daten: Wann und wo wurde das Fahrzeug bewegt? Grafiken und Heatmaps zeigen die Flottenbewegungen und simulieren künftige Entwicklungen recht genau. Man sieht beispielsweise, was an welchen Orten morgens und abends während des Berufsverkehrs passiert und wie der Bedarf sich ändert. Auch am Flughafen zeigt sich, wann Fahrzeuge gebraucht werden, weil der Flugverkehr am dichtesten ist.
"Wir haben jetzt also das schöne Datenmodell, wir speichern alle Maschinendaten in Splunk, wir haben ein Vorhersagemodell entworfen, und jetzt haben wir die Bedarfsvorhersage, die wir eigentlich wollten - aber was fangen wir jetzt mit all dem an?", fragte Saller rhetorisch. Tatsächlich sei die Zahl der Nutzungsszenarien schnell in die Höhe geschnellt. Einfache Maßnahmen mit großer Wirkung hätten schnell initiiert werden können: zum Beispiel die Fahrzeuge nach der Reinigung und Wartung an Orten mit einer hohen Nutzungswahrscheinlichkeit abzustellen.
Auch die Marketing-Abteilung profitierte, konnte sie doch jetzt gezielt Discount-Aktionen starten. "Wenn wir wissen, ein Fahrzeug steht in einem Bereich mit einem bereits gesättigten Bedarf, können wir den Nutzern gezielt einen Nachlass gewähren", so Saller. "Wir verteilen auch die Fahrzeuge besser über die ganze Stadt hinweg."
Außerdem könne BMW schon für die Welt des autonomen Fahrens trainieren: "Wir wollen natürlich alle gerne irgendwann dahin, dass sich die Fahrzeuge von allein in die perfekte Position bewegen. Das ist noch ein bisschen entfernt, aber wenn man schon weiß, wo die optimale Position ist, und die Möglichkeit hat, die Fahrzeuge dorthin zu bewegen, ist das sicher ein großer Vorteil. Auch die Ladestationen für elektrische Fahrzeuge könnten so optimal in der Stadt positioniert werden. "Das sind Erkenntnisse, auf die wir gar nicht abgezielt hatten. Aber andere Fachbereiche haben sich dann für diese Infos interessiert", sagt Saller.
Das Team überlege sich nun, wie die Applikation erweitert und verfeinert werden könne. Dazu gehöre vor allem, Wetter-, Verkehrs- und EventDaten hinzuzufügen. Außerdem gebe es nun eine datenbasierte Grundlage, um zu entscheiden, in welchen neuen Städten der Fahrdienst in welchem Ausmaß ausgebreitet werden kann. "Wir sind nicht mehr darauf angewiesen, zu schätzen oder externe Marktanalysen anfertigen zu lassen. Wir haben eine Datengrundlage", sagt Saller. "Wir können auch die Rentabilität des Dienstes schnell erhöhen, indem wir die Fahrzeugzahl einschränken und dabei den Kundenbedarf exakter abbilden."
Zeppelin überwacht Zündkerzen
Einen Anwendungsfall aus dem Maschinenbau stellten auf der SplunkLive-Konferenz zwei Datenexperten vom Maschinenbaukonzern Zeppelin vor. René Ahlgrim, Manager Data Analytics, beschrieb zunächst, wie sich der Konzern darauf einstelle, mehr Kapital aus den Maschinendaten der installierten Basis und aus den Daten der jeweiligen Servicetechniker zu schlagen. Dabei gehe es auch darum zu verhindern, dass sich Dritte mit passgenauen datenbasierten Services in die Schnittstelle zum Kunden hineindrängten und Teile der Wertschöpfung abgriffen.
Splunk ist bei Zeppelin bereits seit 2010 im Einsatz, man habe damals mit einer "sehr kleinen Lizenz" angefangen. Mittlerweile indiziere Zeppelin Daten aus einer Vielzahl von Quellen, führte Systems Engineer Andreas Zientek aus. "Einer unserer größten Use Cases war 2017 das Monitoring unserer gesamten SAP-Landschaft", sagte Zientek. Das Unternehmen kontrolliere heute konzernweit 65 SAP-HANA-Systeme ausschließlich in Splunk. "Wer die Preise aus dem SAP-Umfeld kennt, der ahnt, dass wir alleine mit diesem Use Case mehr Geld gespart haben, als die gesamte Splunk-Lizenz gekostet hat", schmunzelte Zientek.
2017 kam dann der für das Kerngeschäft bedeutsame Zündkerzen-Use-Case der Unternehmenstochter Zeppelin Power Systems hinzu. Und in diesem Jahr werde das Unternehmen "Splunk IT Service Intelligence" evaluieren, eine auf Machine Learning und Event-Analyse basierende Lösung. "Dann haben wir das gesamte Monitoring innerhalb der Splunk-Plattform umgesetzt", sagte Zientek.
Die Überwachung von Zündkerzen in Heizkraftwerken ist laut Ahlgrim der Schlüssel für mehr Ausfallsicherheit. Diese Anlagen werden zentral über ein Control Center kontrolliert sowie hoch- und runtergefahren. Die Zündkerzen sind am häufigsten die Ursache, wenn Anlagen ausfallen. Laut Ahlgrim wurden die Maschinendaten schon über einen längeren Zeitraum erfasst, aber nie genutzt. Das sei heute anders, denn man wolle die Zahl der Betriebsstunden erhöhen und die für Wartung und Reparatur zuständigen Techniker gezielter einsetzen.
"Wir wollten von reaktiven auf proaktive Services umstellen", sagte Ahlgrim. Servicetechniker sollten nicht mehr losgeschickt werden, wenn das Kind schon in den Brunnen gefallen ist, sondern bereits vorher, wenn sich Probleme andeuten. Außerdem sollen die Techniker ein Service-Display an die Hand bekommen, auf dem sie wichtige Indikatoren für bevorstehende Ausfälle frühzeitig erkennen können.
Laut Zientek erleichterte das Vorhandensein der Logdaten die Vorarbeiten, wenngleich die Datenkonsolidierung nicht trivial gewesen sei: "Die Datenverfügbarkeit ist tückisch bei solchen Projekten. Man verbringt bis zu 85 Prozent der Zeit damit, überhaupt erst die Daten verfügbar zu machen und in das richtige Format zu bringen. Oft wird hier auch Custom Code benötigt. Sind die Daten aber einmal in Splunk, ist die Visualisierung extrem einfach."
Mit Hilfe der Fachkollegen fand das Team schnell heraus, welche Daten wirklich kritisch sind: "Wir lernten schnell, dass vor allem die Zündspannung und die Abgastemperatur, die pro Zylinder gemessen werden, auf Probleme hinweisen können." Die Zündkerzen werden nun über einen Zeitraum von zehn Tagen hinweg in einem Dashboard beobachtet. Auch bei der Abgastemperatur lassen sich Anomalien erkennen.
Dazu wurde mit Hilfe eines Machine-Learning-Tools ein Verfahren zur Anomalie-Detection implementiert. Alle zehn Minuten werden bestimmte Anomaliewerte pro Zylinder gemessen. Neben Durchschnittswerten und Varianzen nutzt das Team auch Wachstumsfaktoren in den einzelnen Metriken oder ein Verfahren, um das Verhalten der Zylinder zueinander zu ermitteln. "So erkennen wir, ob einer aus der Reihe tanzt", sagt Zientek.
Zustand immer im Blick
"Probleme haben wir noch bei den False Positives in den niedrigen Anomalie-Wertebereichen", berichtet der Zeppelin-Ingenieur. "Außerdem ist es so, dass eine Anomalie bei der Zündspannung oder den Abgastemperaturen nicht immer auf einen bevorstehenden Ausfall der Anlage hinweist." Dennoch seien die Informationen wertvoll für den verantwortlichen Techniker.
"Die Techniker können jetzt auf einem Dashboard sehen, wie der Zustand der Zylinder ist", ergänzt Ahlgrim. Die Menge der Ausfälle pro Anlage habe ungefähr halbiert werden können. Manchmal deute sich ein Problem bereits neun Tage vor dem Auftreten an, manchmal aber auch innerhalb von zwei bis zwölf Stunden.
Im nächsten Schritt gehe es um den Rollout entsprechender Lösungen über den gesamten Zeppelin-Konzern mit seinen 13 Tochterfirmen. Dazu habe sich Ahlgrim ein "Arbeitsbuch" angelegt. Dabei gehe es zunächst um das Sammeln der relevanten Daten: "Das treiben wir jetzt massiv, wir brauchen die Daten! Und wir müssen den operativen Bereich einbinden, die Servicetechniker. Wir brauchen die Jungs an der Basis, die schon Hunderte Ausfälle gesehen haben."