Amazon, Cloudera, Hortonworks, MapR & Co.
Hadoop-Distributionen im Kurzprofil
Cloudera
Die US-Firma Cloudera zählt zu den bekanntesten Anbietern von Hadoop-Distributionen. Im März 2014 beteiligte sich Intel mit angeblich 720 Millionen Dollar an dem Unternehmen und brachte seine eigene Hadoop-Technik in die Partnerschaft ein. Clouderas Software dürfte davon profitieren, weil sich Intel bei seinen Hadoop-Versionen auf spezielle Bereiche konzentrierte. Zu nennen sind hier etwa die Performance-Optimierung in Clustern mit Intel-Prozessoren, der Schutz von Daten mittels Verschlüsselung und der Einsatz von Hadoop im Bereich High Performance Computing (HPC).
Cloudera bietet mehrere Versionen von Hadoop an, darunter die kostenfreie Einstiegsvariante "Cloudera Express", eine Ausgabe für Entwickler mit dem Namen "Cloudera CDH" sowie die Enterprise-Edition "Cloudera Enterprise". Die Hadoop-Version für Unternehmen basiert auf Cloudera CDH. Der Hersteller hat eine separate Cluster-Management-Software hinzugefügt, außerdem Support-Leistungen. Nach Einschätzung der Beratungsfirma Flux7 ist die Management-Konsole "Cloudera Manager" einfach zu bedienen und zeichnet sich durch große Übersichtlichkeit und eine Vielzahl von Funktionen aus.
Als weitere Stärken gelten die Möglichkeiten, neue Services im laufenden Betrieb in ein Cluster zu integrieren, und die Verwendung von Node Templates. Mit Hilfe dieser Vorlagen lassen sich auf relativ einfache Weise Gruppen von Cluster-Knoten mit unterschiedlichen Konfigurationen implementieren.