Online Themenspecial
Online Themenspecial
Advertorial

Metadaten sind in einer Multi-Cloud-Welt das wertvollste Gut

von Oliver Schröder
 

Wir haben uns daran gewöhnt, dass Daten als das wertvollste Gut eines Unternehmens bezeichnet werden. Doch in der digitalen Welt von heute gibt es zwei Wahrheiten: Daten bestimmen den Erfolg des Unternehmens und es gibt jede Menge Daten, die verwaltet werden müssen. Und angesichts der letzten Herausforderung gilt ab jetzt ein neuer Grundsatz: Metadaten sind heutzutage das wertvollste Gut jedes Unternehmens.

Dies gilt insbesondere dann, wenn wir uns in einer Welt mit immer mehr Clouds bewegen. Für viele Kunden besteht „die Cloud“ bereits heute aus vielen Clouds mit großen Plattformen wie AWS und Azure sowie spezifischen Plattformen oder Anwendungen wie Oracle, Salesforce, Workday usw.

Obwohl das anfängliche, futuristische Versprechen darin bestand, dass Cloud-Architekturen unser Leben vereinfachen würden, führt die Realität der Multi-Cloud-Architektur zu neuen Komplexitäts- und Integrationsherausforderungen. Grundsätzlich besteht sogar die Möglichkeit, dass wir genau wieder bei den Problemen landen, die wir in der alten Welt erlitten haben: bei nicht miteinander integrierten Applikationen und Datensilos. Um dies zu vermeiden, müssen wir Daten besser verstehen und ihnen vertrauen können.

Doch dies ist nicht einfach. In Gesprächen mit Kunden fällt immer wieder auf, dass Unternehmen Systeme mit mehreren, widersprüchlichen Definitionen von scheinbar einfachen Begriffen wie „Umsatz“ oder „Kunde“ haben. Interessanterweise lautet die Herausforderung nicht zwingend „Wie kann ich festlegen, dass jedes System (und jede Abteilung) einen Kunden auf die exakt gleiche Weise definiert?“ Die Herausforderung lautet vielmehr: „Wie kann ich immer wissen, welcher Datensatz die Kunden so definiert, wie es für eine bestimmte Verwendung angemessen ist?“ (Möchte ich zum Beispiel eine Liste einzelner Käufer oder nur eine Liste der Unternehmen, an die wir unsere Produkte verkaufen?)

Glücklicherweise haben sich die verfügbaren Tools und Technologien weiterentwickelt, um den Erfolg einer Multi-Cloud-Hybridarchitektur wesentlich zu erleichtern. Wir müssen uns nicht länger auf Spreadsheets und SharePoint verlassen, um diese Umgebungen zu verwalten. Das bringt uns wieder zum Wert von Metadaten.

Metadaten bieten neben vielen anderen wichtigen Anwendungsszenarien den erforderlichen Kontext, um Datensätzen zu vertrauen und diese miteinander in Beziehung zu setzen. Metadaten umfassen das Definitions-, Lineage- und Governancemodell rund um alle Daten. Sie geben Auskunft darüber, wie aktuell die Daten sind und von welchen Systemen sie generiert wurden.

Das Repository für all diese Metadaten ist der Datenkatalog. Es ist wichtig, diesen Katalog als ein wesentliches Element jeder Datenstrategie anzusehen. Datenkataloge enthalten automatisierte Tools, die Umgebungen scannen und künstliche Intelligenz verwenden, um alle Daten in allen Systemen schneller und intelligenter zu erfassen. Der Katalog dokumentiert außerdem Verantwortlichkeiten und Prozesse.

Durch die Zentralisierung aller Metadaten wird der Katalog zu einem Universaldecoder, mit dem Sie die Quelle und die Definition Ihrer Daten kennenlernen können, sodass Analysten die Unterschiede zwischen Datensätzen verstehen können. Jetzt können Sie eine "Customer 360" -Initiative verfolgen, die wirklich auf alle relevanten Daten zugreift.

Beim Umgang mit einer Multi-Cloud-Architektur gibt es in der Regel zwei Herausforderungen. Wenn Sie über ein gut verwaltetes Ökosystem verfügen, müssen Sie lediglich sicherstellen, dass jede neue Instanz korrekt zu der Landkarte hinzugefügt wird. Wenn heute der Tag ist, an dem Sie diese zusammenhängende Architektur-Governance etablieren möchten, müssen Sie zunächst die erste genaue Landkarte zeichnen.

Wenn Sie nur eine einzige neue Cloud-Umgebung einführen - beispielsweise eine neue Instanz von Salesforce – sollten Sie sicherstellen, dass die Metadaten jetzt und für die Zukunft solide sind. Starten Sie die neue Instanz von einer Master-Kundenliste aus? Muss eine solche erst erstellt werden? Und welcher Prozess läuft ab, um neue Kundendaten im Laufe der Zeit hinzuzufügen? Wie steuern Sie den Prozess, um sicherzustellen, dass einzelne Vertriebsmitarbeiter keine unvollständigen und/oder doppelten Einträge eingeben? Unabhängig von der Anwendung oder der Umgebung ist es wichtig, sowohl den Ausgangspunkt als auch die künftigen Entwicklungspfade für die Daten festzulegen.

Ein ähnliches, wenn auch wesentlich größeres Projekt ist es, ein Multi Cloud-Ökosystem, das sich im Laufe der Zeit stark verändert hat, zum ersten Mal wirklich in den Griff zu bekommen. Wieder sollten  Sie sich auf Metadaten fokussieren. Machen Sie eine gründliche Bestandsaufnahme der vorhandenen Cloud-Anwendungen und prüfen Sie, wie gut Sie Best Practices auf die Daten angewendet haben. Ermitteln Sie die wichtigsten Problembereiche und finden Sie heraus, ob Sie mit dem Anwenden neuer Geschäftsregeln zum Bereinigen der Daten beginnen oder eine Linie ziehen und die neuen Verfahren nur auf die zukünftigen Daten anwenden. (Manchmal ist es effizienter zu sagen: "Von hier an sind die Daten gut gemanaged und vollständig vertrauenswürdig. Frühere Daten müssen als unvollständig betrachtet werden.")

Die Herausforderungen, die sich bei der Erweiterung in eine Multi-Cloud-Architektur ergeben, zeigen eine der wichtigsten Überlegungen der digitalen Transformation auf: Wir müssen die Zusammenhänge zwischen IT und Business neu überdenken, und zwar ohne  isolierte Datensilos, nicht zusammenhängende Anwendungen und „Wir-gegen-sie“-Prozesse erneut zu generieren. Metadaten als zentrale Quelle für kontextbezogene Informationen und Governance, zentral im Datenkatalog zusammengefasst, werden das zentrale Werkzeug sein, das Organisationen dabei hilft, einen sauberen Schnitt mit einer chaotischen Vergangenheit zu machen.

Mehr Informationen zu Datenkatalogen finden Sie unter diesem Link oder besuchen Sie Informatica und Partner auf der Informatica World Tour am 29.11.2018 in Frankfurt.


Oliver Schröder

ist General Manager & Vice President Sales EMEA Central bei Informatica