BI-Tools und Suiten im Test
Business Intelligence für Geizige
Data Mining - Weka
Data-Mining-Verfahren sind darauf spezialisiert, Muster, Auffälligkeiten und Zusammenhänge in größeren Datensammlungen zu finden. Auf Grundlage der entdeckten Muster lassen sich Vorhersagen für die Entwicklung von Umsatz- oder Kundenzahlen treffen. Data Mining Methoden sind beispielsweise Clustering, Regressions- und Faktorenanalyse, Entscheidungsbäume oder neuronale Netze.
Weka wurde als „Waikato Environment for Knowledge Analysis“ von der Neuseeländer Universität Waikato entwickelt. Entsprechend akademisch ausgerichtet ist das Tool. Die Data-Mining-Verfahren sind beeindruckend vielfältig.
So enthält Weka Funktionen für die Datenaufbereitung, Regressionsanalyse, Klassifikationsverfahren, Clusteranalyse und Visualisierung. Daneben können auch neue Methoden für Maschinelles Lernen erstellt werden. Es gibt kaum ein Data-Mining-Verfahren, das nicht in Weka implementiert worden ist.
Dafür ist das Programm allerdings nicht ganz einfach zu bedienen. Unbedarfte Anwender werden von der Funktionsvielfalt eher abgeschreckt, der Lernaufwand für die Software ist erheblich.
Zwar verfügt Weka über ein Webinterface und eine grafische Benutzeroberfläche. Darauf lassen sich die Algorithmen als Workflows zusammenfügen, so dass diese in Datenanalysen regelmäßig ausgeführt werden können. Doch bei der Verarbeitung von Daten sind proprietäre Produkte in der Handhabung viel mächtiger und transparenter zu bedienen.
Weka wurde wie Kettle und Mondrian 2006 von Pentaho aufgekauft. Seitdem wird das Tool von Pentaho vermarktet und bildet unter der Bezeichnung Pentaho Data Mining den Data Mining Part in deren BI-Plattform. Das Projekt besteht jedoch unter der GNU General Public Licence als eigenständige Anwendung weiter, so dass es auch als alleinstehende Lösung eingesetzt werden kann.