Uni, MOOCs, Selbststudium
Ausbildung zum Data Scientist
Christoph Lixenfeld, seit 25 Jahren Journalist und Autor, vorher hat er Publizistik, Romanistik, Politikwissenschaft und Geschichte studiert.
1994 gründete er mit drei Kollegen das Journalistenbüro druckreif in Hamburg, schrieb seitdem für die Süddeutsche Zeitung, den Spiegel, Focus, den Tagesspiegel, das Handelsblatt, die Wirtschaftswoche und viele andere.
Außerdem macht er Hörfunk, vor allem für DeutschlandRadio, und produziert TV-Beiträge, zum Beispiel für die ARD-Magazine Panorama und PlusMinus.
Inhaltlich geht es in seiner Arbeit häufig um die Themen Wirtschaft und IT, aber nicht nur. So beschäftigt er sich seit mehr als 15 Jahren auch mit unseren Sozialsystemen. 2008 erschien im Econ-Verlag sein Buch "Niemand muss ins Heim".
Christoph Lixenfeld schreibt aber nicht nur, sondern er setzt auch journalistische Produkte ganzheitlich um. Im Rahmen einer Kooperation zwischen Süddeutscher Zeitung und Computerwoche produzierte er so komplette Zeitungsbeilagen zu den Themen Internet und Web Economy inklusive Konzept, Themenplan, Autorenbriefing und Redaktion.
- In den USA ist der Job des Data Analyst etablierter als bei uns. Defizite bei der Ausbildung gibt es aber hier wie dort.
- Auf der anderen Seite des Atlantiks verschafft sich mehr als die Hälfte der Interessenten ihre Skills über Onlineseminare oder Selbststudium.
- In Deutschland ist der gängigste Weg in den Job ein Hochschulstudium, oft mit anschließender Weiterbildung.
Wer in den USA einen Job sucht, der wird im Vorstellungsgespräch viel seltener als bei uns nach einem Hochschulabschluss gefragt. Das gilt tendenziell für alle Positionen, in besonderem Maße aber für solche, die besonders schwer zu besetzen sind.
Eine davon ist die des Spezialisten für Datenanalyse. Welchen Background Bewerber hier mitbringen, wie sie ihre SkillsSkills erwarben und welche Einstellungen und Erwartungen zu ihrem Beruf sie haben, damit hat sich jetzt eine breit angelegte Studie beschäftigt. Alles zu Skills auf CIO.de
Durchgeführt hat sie Kaggle, ein Data Scientists-Portal, dessen Community etwa eine halbe Million Datenspezialisten miteinander verbindet. 2010 gegründet, hat es sich vor allem als Plattform für das Ausrichten von Online-Wettbewerben im Umfeld von Data Science und Machine Learning etabliert.
Kaggle gehört mittlerweile zu Google
Zu den Aufgaben, die mit Unterstützung von Kaggle gelöst werden sollen oder wurden, gehören das Kennzeichnen von Videos, das Klassifizieren von Fischarten oder das bessere Erkennen von Lungenkrebs. Solche Erfolge machen attraktiv: Anfang März 2017 wurde bekannt, dass Google Kaggle übernimmt.
Um zu erfahren, woher die so talentierten Datenspezialisten ihre Kenntnisse und Fähigkeiten haben, befragte Kaggle in den USA 16.000 von ihnen zu Ausbildungswegen und beruflichem Hintergrund.
Nur etwa 30 Prozent derjenigen, die auf dem Gebiet arbeiten, haben an einer Universität studiert, so ein Ergebnis des "2017 State of Data Science & Machine Learning Survey".
Bemerkenswerter als diese Tatsache ist allerdings die Feststellung, woher die übrigen ihre Fertigkeiten haben. 32 Prozent der Fulltime-Datenspezialisten bildeten sich in erster Linie über sogenannte MOOCs (Massive Open Online Course) aus und fort, also über offene Massen-Online-Kurse.
Kostenlose Kurse auf Universitätsniveau
Solche Kurse sind den USA überaus beliebt. Sie verbinden - nicht selten auf Universitätsniveau - traditionelle Formen der Vermittlung wie Videos und gedruckte Materialien mit Foren, in denen Lehrende und Lernende kommunizieren und Gemeinschaften bilden.
- Bilderkennung ist wichtigstes Anwendungsgebiet für Machine Learning
Heute kommen Machine-Learning-Algorithmen vor allem im Bereich der Bildanalyse und -erkennung zum Einsatz. In Zukunft werden Spracherkennung und -verarbeitung wichtiger. - Machine Learning im Anwendungsbereich Customer Experience
Heute spielt Machine Learning im Bereich Customer Experience vor allem im Bereich der Kundensegmentierung eine Rolle (hellblau). In Zukunft wird die Spracherkennung wichtiger (dunkelblau). - Machine Learning in den Bereichen Produktion und Prozesse
Unternehmen erhoffen sich im Bereich Produktion/Prozesse heute und in Zukunft (hell-/dunkelblau) vor allem im Bereich Prozessoptimierung positive Effekte durch Machine Learning. - ML im Bereich Kundendienst und Support
Sentiment-Analysen werden eine Kerndisziplin für Machine Learning im Bereich Kundendienst und Support - Auch IT-Abteilungen profitieren
Schon heute wird Machine Learning für die E-Mail-Klassifizierung und Spam-Erkennung genutzt. In Zukunft (dunkelblau) werden Diagnosesysteme wichtiger. - Was Management, Finance und HR von Machine Learning erwarten
Heute und in Zukunft ist in diesem Bereich das Risikomanagement eine vorrangige ML-Disziplin. In Zukunft soll auch das Talent-Management beflügelt werden. - Massive Effekte für Einkauf und Supply Chain Management
Machine Learning wird sich auf verschiedenste Bereiche des Procurements und des Supply Managements auswirken (hellblau = heute; dunkelblau= in Zukunft) - Diese Lernstile sind bekannt
Beim bekanntesten Lernstil, dem Überwachten Lernen (Supervised Learning), werden Bildern oder Dokumenten von Hand eine gewisse Menge an Tags oder Labeln zugewiesen. So werden die ML-Algorithmen trainiert. - Diese Lernstile verwenden Branchen
Während Autobauer eher auf "Semi-supervised Learning" setzen, sammeln andere Branchen mit Supervised Learning Erfahrung. - Machine-Learning-Algorithmen
Die meisten Unternehmen setzen auf einen Mix von Verfahren, um ihre vielfältigen Aufgaben zu lösen. - Einsatz von Machine-Learning-Algorithmen nach Branchen
Neuronale-Netzwerk-Algorithmen finden vor allem im Automotive-Sektor Verwendung - und natürlich in der ITK-Branche selbst. - Diese Programmiersprachen und Frameworks kommen im ML-Umfeld zum Einsatz
Mit knapp 70 Prozent Einsatzgrad ist Java die führende Programmiersprache im Bereich ML. Allerdings holen speziellere Sprachen und Frameworks auf. - Deep-Learning- und Machine-Learning-Packages
DeepLearn Toolbox, Deeplearning4j, das Computational Network Toolkit und Gensim werden auf Dauer die führenden Pakete sein. - Zielinfrastruktur für ML-Workloads
Die Deployments von Machine Learning gehen zunehmend in die Breite und erreichen auch die Cloud und das Internet der Dinge. Auf die Unternehmen kommt mehr Komplexität zu. - Bedenken und Herausforderungen
Datenschutz und Compliance-Themen machen Anwender am meisten zu schaffen, geht es um den Einsatz von Machine Learning. Außerdem vermissen viele einen besseren Überblick über das Marktangebot. - Machine Learning ist Sache der BI- und Analytics-Spezialisten
Die organisatorische Einführung von ML obliegt meistens den BI- und IT-Profis. Viele Anwender holen sich aber auch externe Hilfe. - Wo Externe helfen
Datenexploration, Skill-Aufbau und Implementierung sind die Bereiche, in denen Machine-Learning-Anfänger am häufigsten externe Hilfe suchen.
Viele der Kurse sind kostenlos, einzige Voraussetzung zur Teilnahme ist oft ein Internet-Zugang - und ein ausreichendes Interesse des Nutzers.
Darüber hinaus gaben 27 Prozent der Kandidaten an, sich ihre Kenntnisse sogar über selbst zusammengestelltes Material, Kurse und Fortbildungen angeeignet zu haben.
Gehalt von 110.000 Dollar beim Einstieg
Interessant ist diese Zahl vor allem deshalb, weil Datenspezialisten gemäß dem sogenannten Glassdoor´s-Ranking zu den bestbezahlten Angestellten in den USA zählen. Die Creme unter ihnen, Data Scientists (eine Kombination aus Statistiker, Software-Entwickler und Datenanalyst), bekommen ein Einstiegsgehalt von durchschnittlich 110.000 Dollar im Jahr.
Das Angebot an Bewerbern ist schmal und talentierte Leute sind ausgesprochen schwer zu finden. Und wenn sie irgendwo angeheuert haben, dann suchen sie sofort nach einer noch besseren oder spannenderen Position, auch das ist ein Ergebnis der Glassdoor-Studie.
39 der Befragten verbringen mindestens ein bis zwei Stunden pro Woche mit dieser Suche, 12 Prozent sogar drei bis fünf Stunden. Wichtigstes Motiv ist dabei der Wunsch, eine inhaltlich spannendere Rolle zu bekleiden: 59 Prozent derjenigen, die diese Top-Position noch nicht erreicht haben, sagen, dass sie nach einem Job als Data Scientist suchen.
Selbststudium spielt in Deutschland kaum eine Rolle
In Deutschland stellt sich die Situation anders dar, weil Berufe in diesem Umfeld weniger bekannt und etabliert sind. Noch, sollte man an dieser Stelle hinzufügen, denn hier bewegt sich gerade viel.
Die meisten Data Analysts bei uns sind Mathematiker und/oder Statistiker, und natürlich gibt es auch in Deutschland zu wenig davon. Dringend auf der Suche sind vor allem Banken/Versicherungen und der gesamte medizinische Bereich, Branchen, die sich intensiver als andere mit statistischen Analysen beschäftigen.
Auch für die Autoindustrie werden diese Spezialisten immer wichtiger, weil viele Daten mittlerweile direkt aus den Fahrzeugen kommen und die Hersteller dadurch direkten Kontakt zum Kunden bekommen und auch bekommen wollen.
Die Ausbildung wird weit weniger vom Self-Learning-Gedanken beherrscht als in den USA, sondern auch bei solchen Jobs dominieren die klassischen Bildungswege.
In Deutschland geringere Einstiegsgehälter
So hat das Bundesministerium für Bildung und Forschung zwei Big-Data-Kompetenzzentren aufgebaut: das Berlin Big DataBig Data Center (BBDC) unter der Leitung der TU Berlin und das Competence Center for Scalable Data Services (ScaDS) an der TU Dresden. Andere Hochschulen haben ähnliche Pläne. Alles zu Big Data auf CIO.de
Eine Studie des Branchenverbands Bitkom hat ermittelt, dass bei 45 Prozent aller ausgeschriebenen IT-Positionen ausdrücklich Kenntnisse in Big Data erwartet werden. Informatiker mit diesem Hintergrund bekommen auch bei uns gute Einstiegsgehälter, wobei das Niveau deutlich niedriger ist als in den USA.
Hochschulabsolventen mit Kenntnissen in Datenanalyse steigen hierzulande laut Bitkom mit etwa 45.000 Euro brutto pro Jahr in den Job ein, bei großen Unternehmen ist es etwas mehr, bei kleineren etwas weniger. Am meisten bezahlen die Finanzindustrie, Automobilhersteller und die Energiewirtschaft.