Das Datenlabor am Data Lake: ungeahnte Datenschätze heben und nutzen

Das Datenlabor am Data Lake: ungeahnte Datenschätze heben und nutzen

Du hältst das Datenwachstum deines Unternehmens für dramatisch, gleichzeitig weisst du, dass da draussen tagtäglich noch viel grössere Datenmengen entstehen, die darauf warten, analysiert zu werden. Diese Datenberge sind unbezahlbare Schätze. Aber wie kannst du aus diesen Datenmassen einen Mehrwert gewinnen? Hier kommt der Data Lake ins Spiel.

Der Data Lake ist eine Architektur, mit der dein Unternehmen es schafft, grosse Datenmengen, auch unstrukturierter Daten, effizient und zielgerichtet zu verwalten. Gleichzeitig ist der Data Lake so aufgebaut, dass jederzeit auch neue Informationen aus bearbeiteten und gespeicherten, aber auch bisher unbearbeiteten Daten, abgeleitet werden können. Damit geht die Leistungsfähigkeit einer Data-Lake-Architektur weit über das hinaus, was heute schon oft als Business-Intelligence-Lösung auf Basis eines Data Warehouses vorhanden ist.

Vorteile eines Data Lakes

Im Gegensatz zu einem Data Warehouse, das eingeschränkte Daten endanwendergerecht und einfach konsumierbar zur Verfügung stellt, stehen im Data Lake sämtliche Daten und damit auch Informationen zur Verfügung. Damit sind also aussagekräftigere und tiefer gehende Analysen möglich – insbesondere im explorativen Bereich. Zudem geht ein Data Lake am besten mit einer Fast-Data Komponente einher, mit der Datenströme praktisch in Echtzeit ausgewertet werden können.

cp-Neues-Business-dank-Data-Lake_ib

Wir sind überzeugt davon: Data Lake macht deinen Job leichter und den deiner Kollegen besser. Lass uns darüber sprechen, welche Möglichkeiten für euch die besten sind.


Anwendungsszenarien

Überall dort also, wo vielfältige Datenmasse, insbesondere auch Sensordaten, anfallen und schnell verarbeitet werden müssen, bieten sich Data Lakes an.

In der Kundenbetreuung ist heute topaktuelle 360-Grad-Betreuung erforderlich. Nahezu in Echtzeit müssen im Service und Support Antworten auf folgende Fragen verfügbar sein: Welche Bestellung wurde vor wenigen Minuten aufgegeben, wie zufrieden war der Kunde mit der Bestellung, welche Webseiten hat der Kunde vor und nach seinem Besuch angesurft, welche Spuren hat der Kunde auf der Webseite deines Unternehmens hinterlassen usw. Nur so kannst du deinen Kunden bestmöglich betreuen.

Auch die Qualitätskontrolle erfordert oft den Blick in die nähere und weitere Vergangenheit mittels Big-Data-Analytics. Wenn die Ausfallrate steigt, dadurch die Kosten in die Höhe getrieben werden und das Vertrauen deiner Kunden beeinträchtigt wird, braucht es viele Daten, um das Problem zu identifizieren und zu lösen. Dazu kann die Auswertung jahrealter Daten gehören, wie Produktionsparameter, Chargen, Testresultate, Telemetrie, Rückläufer, Fehlerbeschreibungen und vieles mehr. Dazu braucht es natürlich die Methoden und Skills, aus diesen Daten die richtigen Schlüsse zu ziehen.

Umgekehrt kannst du mit analytischen Verfahren und einer grossen Datenbasis Ausfälle und aufkommende Qualitätsprobleme vorhersagen, sogenannte Predictive Analytics betreiben. Damit kannst du Risiken nicht nur zuverlässiger identifizieren, sondern oft auch im Vorfeld minimieren.

Mach dir deinen Job leichter und den deiner Kollegen besser, indem du Self-Service-Analytics anbietest. Kosten werden gesenkt und der Nutzen erhöht, wenn sich PowerUser und Data Scientists ihre Datenbasis und darauf basierende Auswertungen schnell und einfach aus einem Data Lake selbst zusammenstellen können. Dafür brauchst du eine gut geplante und automatisierte Analytics-Plattform mit einem „Governed Data Lake“ und den richtigen Werkzeugen, die viel Flexibilität bietet. Für den Aufbau benötigst du den Sachverstand von Experten und eine realistische Erwartungshaltung. Schliesslich muss das Rad nicht extra für dein Unternehmen neu erfunden werden, sondern du brauchst eine stabile Plattform mit wiederverwendbaren Komponenten, die in verschiedenen Kombinationen bereits ausgiebig getestet sind.

Am besten ist dein Data Lake mit deinem Data Lab in der Cloud angesiedelt. Analytische Datenplattformen sind prädestiniert für den Betrieb in der Cloud. Die gängigen Lösungen von Microsoft, Oracle, Amazon oder Google bieten leistungsfähige Werkzeuge und Dienste für alle Aufgaben. Insbesondere die Möglichkeit, fast ohne Vorlaufzeit eine Umgebung aufzubauen und die enorme Elastizität der Ressourcen, also die Fähigkeit für bestimmte Aufgaben oder Zeiten kurzfristig hundert- oder tausendmal so viel Rechenleistung zu nutzen, macht diese Option so attraktiv und zur idealen Umgebung. Die IT-Abteilung deines Unternehmens muss dafür die notwendigen Ressourcen nicht selbst dauerhaft vorhalten.

Mit einem geeigneten Data Governance Ansatz zur Datenverwaltung und Ownership, sowie fortgeschrittenen Metadata-Lösungen und analytischen Methoden finden die Mitarbeiter deines Unternehmens jederzeit die passenden Informationen und interpretieren sie richtig. Die Produktivität steigt, wenn eine einfache Suche alle passenden Berichte, Datenquellen, Datenbeschreibungen und Prozesse sauber und korrekt listet und gleich noch direkten Zugriff darauf bietet. Noch besser wird es, wenn deine Kollegen diese Informationen über Daten nicht erst mühevoll manuell zusammengetragen und aufbereiten müssen, sondern wenn das die Softwarelösung selbst macht und dazu noch passende Querverbindungen entdeckt und vorschlägt. Solche Lösungen realisieren wir von Trivadis in deinem Unternehmen auch mit Technologien der künstlichen Intelligenz wie Natural Language Processing oder Semantic-Web Verfahren.

Nur wenn dein Unternehmen in Digitalisierungsprojekten so aufgestellt ist, dass es die Anforderungen an digitalisierte Kunden-, Lieferanten-, und Partnerbeziehungen erfüllt, wird es nachhaltig erfolgreich sein. Was du brauchst sind Architekturen, Technologien und Plattformen um mit den Datenmengen fertig zu werden und Experten, die dich dabei unterstützen. Wir helfen dir gerne, mit dir für dein Unternehmen einen Data Lake aufzubauen.

Trivadis verfügt über mehr als 25 Jahre Erfahrung und gesammeltes Know-how im Umgang mit Daten. Mit unseren erprobten Vorgehensweisen in der Planung und Entwicklung von Data-Lake-Architekturen und Data Labs helfen wir dabei, mit überschaubarem Aufwand eine Plattform aufzubauen, die sukzessive weiterentwickelt werden kann. Data Warehouses und Data Lakes werden dafür mit Automatisierungswerkzeugen quasi industrialisiert, so dass Kosten und Aufwände auf ein Minimum reduziert werden.

Wenn du mehr darüber erfahren willst, wie du mit einem Data Lake grösseren Nutzen aus deinem Datenschatz ziehen kannst, informiere dich hier.

Du hast Fragen oder benötigst Unterstützung bei deinem Projekt?

Wir sind für dich da und helfen dir gerne weiter.