Amazon, Cloudera, Hortonworks, MapR & Co.
Hadoop-Distributionen im Kurzprofil
Hortonworks
Die aktuelle Version 2.1 der "Hortonworks Data Platform" steht seit Kurzem zur Verfügung. Eine Besonderheit ist, dass Hortonworks nicht nur Linux, sondern auch Windows unterstützt. Die Hadoop-Distribution enthält unter anderem die Tools Stinger Solr und Storm, aber auch Lösungen für Sicherheit sowie IT- und Daten-Governance.
Hortonworks gilt als treibende Kraft hinter der Einführung von YARN (MapReduce 2.0) und zählt zudem den eifrigsten Lieferanten von Programmcode für Hadoop und entsprechende Erweiterungen. YARN ist eine Ergänzung von MapReduce, der traditionellen Batch-Komponente von Hadoop.
Den Consultants von Flux7 zufolge fallen die Performance-Daten der Distributionen von Cloudera und Hortonworks ähnlich aus. Schwächen weist demnach Hortonworks beim Cluster-Management auf. Dieses sei "primitiver" als das bei anderen Distributionen und daher verbesserungsfähig. Allerdings bezieht sich diese Kritik auf die überholte Version 1.3 der Hortonworks Data Platform. Seit April 2014 steht HDP 2.1 zur Verfügung, inklusive Ambari, einer durchaus leistungsstarken Cluster-Management-Konsole.
Ein Pluspunkt ist zudem die Integration von Apache Stinger. Damit will Hortonworks Apache Hive bis auf das Hundertfache beschleunigen. In der aktuellen Ausgabe HDP 2.1 ist Stinger Phase 3 enthalten. Weitere Komponenten von HDP aus der Hadoop-Ökosphäre sind unter anderem Apache Falcon für das Replizieren von Daten und die Authentifizierungssoftware Knox.