Online Magazine
ML-Plattform – was ist das und warum brauchst du eine?

Wusstest du, dass 90 Prozent der Machine-Learning-Lösungen es nie in die Produktion schaffen? Die richtige ML-Plattform kann eine entscheidende Rolle dabei spielen, dies zu verhindern.
von Sunanda Garg

Unternehmen auf der ganzen Welt erkennen mittlerweile die Vorteile, die Daten, künstliche Intelligenz (KI) und Machine Learning (ML) ihnen bringen können. Doch der Weg dorthin ist alles andere als einfach.
In einer Accenture-Umfrage aus dem Jahr 2019 gaben 84 Prozent der Führungskräfte an, dass sie ihre Wachstumsziele ohne die Skalierung von KI nicht erreichen würden. Genau dafür profitieren Unternehmen von einer sogenannten ML-Plattform. Im heutigen von Anbietern überfluteten Markt kann es jedoch schwierig sein, eine fundierte Entscheidung ("Build vs. Buy") bezüglich einer Plattform zur Skalierung von KI zu treffen.
Dieser Artikel soll daher einen Ausgangspunkt bieten, um sich mit dem Thema Machine-Learning-Plattformen zu befassen. Er erklärt zunächst, was eine ML-Plattform ist und warum dein Unternehmen eine braucht, und gibt dann einen Überblick über die ML-Plattformen auf dem Markt und wie du die für dein Unternehmen am besten geeignete findest.
Was ist eine ML-Plattform?
In vielen Bereichen der Forschung und Industrie werden künstliche Intelligenz und maschinelles Lernen zur Problemlösung immer beliebter. Zwar werden grosse Anstrengungen unternommen, um die Leistung von ML-Modellen weiter zu verbessern, doch die eigentliche Schwierigkeit besteht darin, sie aus den Labors in die Produktion zu bringen.
Während ML in Unternehmen immer mehr Fuss fasst, haben die Teams, die ML-Lösungen entwickeln, mit der Komplexität des ML-Lebenszyklus zu kämpfen. Daher besteht eine grosse Nachfrage nach Lösungen, die bei der Verwaltung des gesamten ML-Lebenszyklus helfen. Cloud-Anbieter bieten beispielsweise native Dienste an, die verschiedene Aspekte des ML-Lebenszyklus unterstützen, und auch eine wachsende Zahl von Softwareanbietern erweitert ihr Angebot in diese Richtung. Darüber hinaus drängen immer mehr Start-ups mit innovativen Lösungen und ML-Diensten auf den Markt.
Doch was genau ist nun eine ML-Plattform?
Eine ML-Plattform ist definiert als eine Sammlung von Diensten, die den gesamten ML-Lebenszyklus abdeckt und Unternehmen bei der kontinuierlichen Entwicklung, Bereitstellung, Integration und Überwachung ihrer KI- und ML-Lösungen unterstützt.
Warum braucht dein Unternehmen eine ML-Plattform?
ML-Modelle werden oft auf sehr komplexe, fast unverständliche Weise entwickelt. Die Komplexität von ML-Lösungen und deren Entwicklungsprozess ist insbesondere auf folgende Faktoren zurückzuführen:
- Unterschiedliche Programmiersprachen und Tools: Data Scientists beginnen den ML-Lebenszyklus in der Regel mit verschiedenen Programmiersprachen (z. B. Python und R) sowie Tools (Jupyter Notebook, RStudio, PyCharm) in verschiedenen Versionen.
- Unterschiedliche Bibliotheken: Ausserdem verwenden sie in der Regel unterschiedliche Bibliotheken (z. B. TensorFlow, scikit-learn, XGBoost) für die Anwendung von Algorithmen wie logistische Regressionen, neuronale Netze, baumbasierte Klassifikatoren usw.
- Kleine Stichproben von Daten: In vielen Fällen erstellen die Data Scientists einen Prototyp mit einer kleinen Datenprobe, die normalerweise von den verfügbaren Ressourcen (z. B. Speicher und CPUs) ihrer Laptops oder Workstations unterstützt wird.
- Spezifische Merkmale und Metriken: Die aus den Rohdaten erstellten Datensätze (auch Features genannt) werden verwendet, um die Modelle lokal zu trainieren, und die Leistung und Erkenntnisse werden mit Hilfe geeigneter Metriken (z. B. in Jupyter Notebooks) visualisiert.
- Potenzielle Nichterfüllung von Geschäftsanforderungen: Die Tools, Frameworks und Datenanforderungen in dieser Modellentwicklungsphase stimmen möglicherweise nicht mit der vom Unternehmen geforderten produktionsreifen Lösung überein.
Die auf diese Weise entwickelten Lösungen generieren wenig bis gar keinen Wert und haben keine geschäftlichen Auswirkungen. Um ihr volles Potenzial freizusetzen und kontinuierlich Wert zu schaffen, müssen sie aus der Experimentierphase herausgenommen und grundlegend in die Geschäftsprozesse des Unternehmens integriert werden. Dies ist jedoch nur möglich mithilfe bestimmter Komponenten wie
- einer effizienten Datenpipeline,
- einem kontinuierlichen Integrations- und Bereitstellungsprozess und
- Artefakt- und Metadatenmanagement.
Nur ein umfassender Satz von ML-Komponenten – oder anders gesagt eine ML-Plattform – ermöglicht den Übergang zur nächsten Phase des ML-Lebenszyklus, in der die sorgfältig trainierte und ausgewählte ML-Lösung aus dem Labor in die reale Welt gelangt. Schliesslich möchte man nicht, dass die eigenen Modelle zu den erstaunlichen 90 Prozent gehören, die nie das Licht der Welt erblicken.
Theoretisch kann jeder seine eigene ML-Plattform aufbauen. Das haben viele der Tech-Giganten getan, z. B. Uber (Michelangelo), Airbnb (Bighead), Facebook (FBLearner), Netflix (Metaflow) und Apple (Overton), um nur einige zu nennen. Doch während das für Unternehmen mit grossen Ingenieurteams durchaus möglich ist, ist es für die Mehrheit der Unternehmen kein gangbarer Weg. Um diese Hürde zu überwinden und die Lücke zu schliessen, bieten PaaS-ML-Plattformen zunehmend eine Lösung.
Welche ML-Plattformen gibt es auf dem Markt?
Um die Komplexität der Verwaltung des ML-Lebenszyklus zu bewältigen, setzen immer mehr ML-Teams auf PaaS-Lösungen. Mehrere Anbieter und Cloud-Provider bieten End-to-End-ML-Plattformen und/oder -Dienste an, darunter AWS (Amazon Web Services), Microsoft Azure, Google Cloud Platform, Databricks, Dataiku, H2O.ai und einige andere.
Cloud-Anbieter bieten mehrere Möglichkeiten zur effektiven Unterstützung der meisten, wenn nicht sogar aller Komponenten des ML-Lebenszyklus und bieten Flexibilität, allerdings auf Kosten eines relativ hohen Cloud-Engineering-Aufwands. Andererseits bieten proprietäre Lösungen wie Databricks, Dataiku und Domino sofort einsatzbereite Dienste für den ML-Lebenszyklus, welche die ML-Journey mit einer gewissen Einbusse an Flexibilität vereinfachen können.
Die brennende Frage: Welche ist "die beste ML-Plattform"?
Die Auswahl an ML-Plattformen auf dem Markt ist gross, und die offensichtliche Frage, die sich jedes ML-Team oder -Unternehmen am Anfang stellt, ist: Welche ist die beste? Sicher ist, dass es nicht die eine ML-Plattform gibt, die für alle stimmt. Oder anders ausgedrückt: Es gibt nicht die beste ML-Plattform. Ganz gleich, wie gut ein Produkt- oder Dienstleistungsanbieter zu sein behauptet, es gibt garantiert Wettbewerber mit einem ähnlichen Angebotsportfolio. Die richtige Frage, die man sich stellen sollte, lautet stattdessen:
Welche ML-Plattform ist für mein Unternehmen am besten geeignet?
Die Wahl einer ML-Plattform hängt von drei Dingen ab:
- Das Qualifikationsniveau deines Teams: Wenn dein Team mehr aus Data Scientists als aus Engineers besteht, wird die Wahl der Plattform ganz anders ausfallen als bei einem engineer-lastigen Team. Eine Plattform ist nur dann gut für die Bedürfnisse deines Teams geeignet, wenn sie die täglichen Aufgaben vereinfacht und so die ML-Journey vorantreibt.
- Die Arten von ML-Anwendungsfällen: Die Plattform sollte die verschiedenen Arten von ML-Anwendungsfällen unterstützen, die dein Unternehmen zu lösen versucht sowie die auf der Roadmap stehenden Fälle. Anwendungsfälle haben individuelle Anforderungen, wie z. B. Computer Vision, Natural Language Processing (NLP), Big Data Analytics usw., und einige Plattformen unterstützen eine (oder mehrere) besser als die andere.
- Die technische Schuld deines Unternehmens: Die gewählte ML-Plattform sollte diese technische Schuld reduzieren. Nahezu jede Plattform bietet verschiedene Arten von Lösungen an, die unterschiedliche Komponenten des ML-Lebenszyklus abdecken (z. B. Model Registry, Experiment Tracking, Feature Store). Die Auswahl einer ML-Plattform, die hilft, diese Lücken zu schliessen, wird die ML-Journey deines Unternehmens beschleunigen.
Um die am besten geeignete ML-Plattform für dein Unternehmen zu finden, ist ein ML-Capability-Framework erforderlich, das dir hilft, alle oben genannten Aspekte über mehrere Plattformen hinweg einheitlich zu bewerten. Die richtige Entscheidung zu treffen ist besonders wichtig, da eine langfristige Bindung an einen bestimmten Anbieter (Stichwort „Vendor Lock-in“) kostspielig sein kann.

MEHR TECH-THEMEN:

