Die größte Bibliothek der Welt, die Library of Congress, beherbergt 155 Millionen Medien.
Sie umfasst unter anderem 33 Millionen Bücher und Druckerzeugnisse in 470 Sprachen, 50 Millionen Handschriften, 12,5 Millionen Fotografien und 5,4 Millionen Pläne und Karten
Dies entspricht einem geschätzten Datenvolumen von ca. 462 Terabytes.
Das allein ist schon beeindruckend genug, bedenkt man aber außerdem, dass auf Twitter jeden Tag 7 Terabyte Daten generiert werden (dies entspricht dem Datenvolumen der Library of Congress alle 9 Wochen) und auf Facebook 10 Terabyte pro Tag (was lediglich 7 Wochen für die gleiche Datenmenge bedeutet), so bekommt man einen kleinen Eindruck, was sich hinter dem Zauberwort "Big Data" verbirgt.
Es kann unterschiedliche Ursachen geben, warum große Datenmengen entstehen, seien es regulatorische Gründe, die ein Vorhalten von Daten über viele Jahr(zehnt)e erfordern, die Nutzung der Daten im Präsens oder die präventive Sammlung für die Zukunft. Da ein Aussortieren von Daten oft nicht möglich oder gewünscht ist oder die Daten aus gutem Grund gesammelt und vorgehalten werden, wird die Datenmenge wachsen.
Viele Unternehmen entscheiden sich aktuell aus diesen oder ähnlichen Gründen für den Wechsel in die hybride Cloud. Dahinter verbirgt sich, vereinfacht gesagt, die Kombination einer selbstverwalteten IT-Infrastruktur im eigenen Hause (Private Cloud) mit Serviceleistungen aus der Public Cloud, welche von einem Dienstleister gestellt werden.
Diese "Wokpfanne der IT" bietet quasi das Beste aus beiden Welten, in einer Lösung vereint.
Was für die Hybrid Cloud spricht
Skalierbarkeit: Eine hohe Skalierbarkeit bietet auch bei saisonalen Geschäften, vorhersehbaren oder unvorhersehbaren Spitzen (wie beispielsweise Naturkatastrophen oder dem Schnäppchenfreitag) gleichbleibende Leistungsfähigkeit.
Schnelle Bereitstellung: Die schnelle Bereitstellung von Diensten oder Infrastruktur aus der öffentlichen Cloud kann die Beschaffung von oft mehreren Wochen oder Monaten auf Stunden oder Minuten verkürzen.
Zugriff: In der Public Cloud ist der Zugriff zu jeder Zeit und von jedem Ort der Welt aus möglich. Je nach gewählter Art der Anbindung und Datenübertragung können zudem die Vorteile eines physisch getrennten Backups greifen. Werden die Daten der Private Cloud in die Public Cloud dupliziert, so können im Schadensfall die Daten wiederhergestellt werden (Disaster Recovery).
Kosteneinsparung: Dieser Punkt hängt von mehreren Kriterien ab und kann dadurch höher oder niedriger ausfallen. Bedenkt man aber neben den reinen Hardwarekosten auch Betriebskosten wie Strom, Personal und Miete oder indirekte Kosten wie Wartung (Systeme müssen herunter gefahren werden, wodurch beispielsweise Produktionspausen forciert werden) und bezieht man außerdem die Möglichkeit ein, dass Systeme bei Nichtgebrauch vollständig heruntergefahren werden können, wodurch bei Cloud-Diensten die Kosten in dieser Zeit nahezu aufgehoben werden, so können die Kosten für eine On-Premises-Landschaft die einer hybriden Struktur erheblich übersteigen. Werden aber zum Beispiel Test&Dev oder Trainingssysteme nachts und bei Nichtgebrauch heruntergefahren, können sich die Kosten erheblich reduzieren.
Möglichkeiten der Datenbankanbindung
Wenn man sich nun für die eine oder andere Form der hybriden Cloud entschieden hat und ein Projekt definiert ist, stellt sich die Frage, wie die Daten nun zwischen den beiden Welten ausgetauscht werden können. Dies kann entweder mit einer direkten Datenbankanbindung geschehen, oder indirekt:
Bei der direkten Anbindung (Replikation) können alle Daten (oder eine Teilmenge) synchronisiert werden. So lassen sich zum Beispiel Wetterdaten in der eigenen Infrastruktur sammeln, aufbereiten und berechnen, und nur die Wettervorhersage oder Hochwasserinformationen werden auf dem öffentlichen Portal über die Public Cloud zur Verfügung gestellt. Abhängig von der Auslastung der Website kann nun über die Public Cloud skaliert werden.
Die indirekte Datenbankanbindung kann über mehrere Wege erfolgen - per Webservice, als Upload eines Backups und über eine Applikation:
Die Anbindung der Datenbank per Webservice bietet sich an, wenn die Datenbank das Protokoll, mit dem man die Daten hochladen möchte, nicht "spricht", oder Daten aus unterschiedlichen Quellen gebündelt werden sollen und eine Authentifizierung nötig ist. Außerdem wird sie gewählt, wenn die Daten zuvor aufbereitet oder validiert werden müssen, bevor sie in die Datenbank geschrieben werden. Dies wäre zum Beispiel der Fall, wenn Außendienstmitarbeitern per mobiler Anwendung Daten aus ERP-, CRM- und DMS-Systemen zur Verfügung gestellt werden sollen.
Ein Upload eines (Teil-)Backup als Blob aus der bestehenden Datenbank bietet sich an, wenn die Datenmenge sehr groß ist. Dies kann in der Regel über die Verwaltungs-API der Anbieterdatenbank importiert werden. Beispielszenario: Die Videodateien von Überwachungskameras sollen zur Archivierung in die Public Cloud verlagert werden.
Die Anbindung über eine Applikation wird unter anderem gewählt, wenn eine Anwendung, die in der Public Cloud läuft, an eine in der Private Cloud betriebene Datenbank angebunden werden soll. Die Anbindung erfolgt über die - typischerweise vom SAAS-Betreiber zur Verfügung gestellte - Schnittstelle. Wird ein CRM-System zum Beispiel als Software as a Service (SaaS) bezogen, können Mediendaten, Dokumente oder Daten aus dem ERP-System aus der On-Premises-Landschaft angebunden werden.
Die Herausforderungen
Bei allen Optionen gilt es jedoch, die Vorteile und Herausforderungen gegeneinander abzuwägen. Da diese nicht nur während der Migrationsphase, sondern auch im Betrieb relevant sind, ist eine umfassende vorherige Betrachtung ratsam. Es lässt sich hier keine allgemeine Empfehlung aussprechen, da die Gewichtung der Vor- und Nachteile von vielen individuellen Faktoren abhängt.
Performance: Hier kommt es sehr auf die Latenz zwischen On-Premises-Struktur und Cloud-Anbieter an.
Die Synchronie der Daten (z.B. bei einem Fehlschlag einer Synchronisation) wiederum ist wohl bei einer Anbindung per Applikation am besten, da zumeist über den Connector eine Erfolgsprüfung stattfindet. Dies ist beispielsweise bei einer Replikation standardmäßig nicht gegeben, so dass eine "manuelle" Reparatur nötig wird.
Die Sicherheit der Daten während der Übertragung (data in transit) reicht von unverschlüsselt (direkte Datenbankanbindung) bis hin zur HTTPS-Verschlüsselung (Webservice) und ist ebenfalls davon abhängig, welche Methode(n) der Anbieter der Public Cloud zur Verfügung stellt.
Beim Thema Flexibilität, sprich: wie einfach ein Wechsel des Cloud-Anbieters ist, schneidet die direkte Datenbankanbindung am besten ab. Auch der Webservice ist in der Regel relativ einfach umzuziehen. Beim Import des Backups kommt es auf den Anbieter an und bei der Anbindung über eine Anwendung muss typischerweise der Connector angepasst werden.
Fazit
Die angesprochenen Punkte erheben keinen Anspruch auf Vollständigkeit, ebenso wenig geht es hier um die Empfehlung der Ideallösung. Vielmehr will dieser Beitrag einen Einblick in die Möglichkeiten rund um das Thema Hybrid Cloud geben - und zur sorgfältigen Planung vor dem ersten Schritt anregen. Ich wünsche Ihnen viel Erfolg bei Ihren IT-Projekten!