Technologie erklärt: Data-Science-Fachjargon für Business-Entscheider



Wenn Sie ein Datenwissenschaftler sind oder mit Machine-Learning-Modellen arbeiten, verwenden Sie Tools, um Daten zu labeln, Technologieumgebungen, um Modelle zu trainieren, und bringen ein grundlegendes Verständnis von MLops und Modelops mit. Wenn Sie ML-Modell in der Produktion einsetzen, nutzen Sie sehr wahrscheinlich auch ML-Monitoring, um Data Drift und andere Risiken in Zusammenhang mit den Modellen zu identifizieren.

Datenwissenschaftler setzen diese grundlegenden ML-Praktiken und -Plattformen ein, um gemeinsam Modelle zu entwickeln, Infrastruktur zu konfigurieren und Modelle in großem Umfang zu pflegen. Darüber hinaus sind diese Tools auch wichtig, um die Anzahl der Modelle in der Produktion zu erhöhen, die Qualität von Vorhersagen zu verbessern und die Kosten für die Modellwartung zu senken.

Diese Praktiken und Tools Business- und Budget-Entscheidern zu vermitteln, die den Return on Investment und Business Impact von ML- und KI-Investitionen verstehen wollen, ist kein leichtes Unterfangen. Das Data-Science-Fachchinesisch wirkt auf sie vor allem abschreckend. Deshalb sollten Sie alles daransetzen, Ihren Jargon zu definieren und zu simplifizieren, damit alle Stakeholder um die Bedeutung der Schlüsseldisziplinen im Bereich Datenwissenschaft wissen und diese durchdringen können.

Last update on 2024-04-19 / Affiliate links / Images from Amazon Product Advertising API

Last update on 2024-04-19 / Affiliate links / Images from Amazon Product Advertising API

Als Entwickler oder Datenwissenschaftler verfügen Sie über einen technischen Prozess, mit dem Sie neue Ideen umsetzen können – vom Konzept bis hin zum Business Value. Dieser Lebenszyklus-Prozess umfasst:

  • die Definition der Problemstellung,
  • Modellentwicklung und -Testing,
  • Deployment von Modellen in Produktionsumgebungen,
  • Modell-Monitoring, sowie
  • Wartung/Pflege und Optimierungen.

Business-Entscheider verstehen den Begriff Lebenszyklus unter Umständen nicht. Viele sehen Softwareentwicklung und Data Science immer noch als einmalige Investitionen an – was allzu oft zu technischen Schulden und Problemen mit der Datenqualität führt. Wenn es darum geht, Business-Menschen den ML-Lebenszyklus zu vermitteln, sollten Sie auf Begriffe wie Modellentwicklung, Deployment und Monitoring verzichten.

Marcus Merrell, Vice President of Technology Strategy beim Testing-Spezialisten Sauce Labs, empfiehlt stattdessen, auf Analogien aus der realen Welt zu setzen: “Machine Learning ist in gewisser Weise mit der Landwirtschaft vergleichbar: Die Nutzpflanzen, die wir heute kennen, sind das ideale Ergebnis früherer Generationen, die Muster erkannten, mit Kombinationen experimentierten und Informationen mit anderen Landwirten austauschten, um mit dem gesammelten Wissen bessere Variationen zu schaffen. Maschinelles Lernen ist ein ganz ähnlicher Prozess, nur dass dabei ein Algorithmus trainiert wird.”

Diese Analogie ist in meinen Augen besonders treffend, weil sie generatives Lernen veranschaulicht, aber auch Anpassungen in Echtzeit berücksichtigen kann (die beispielsweise aufgrund von Wetterlagen oder Lieferkettenfaktoren auftreten).

Für die meisten Entwickler und Datenwissenschaftler ist MLops das Machine-Learning-Äquivalent zu DevOps. Infrastruktur, Deployment und andere technische Prozesse zu automatisieren, verbessert die Zusammenarbeit und hilft den Teams, sich auf die Geschäftsziele zu fokussieren, statt sich manuell an technischen Tasks abzuarbeiten. Für die Business-Entscheider im Unternehmen sind diese Zusammenhänge nur schwer zu durschauen, insbesondere wenn ein Team dringend Budget für Tools oder Zeit für die Einführung von Best Practices benötigt.

Last update on 2024-04-19 / Affiliate links / Images from Amazon Product Advertising API

Last update on 2024-04-19 / Affiliate links / Images from Amazon Product Advertising API

“MLops oder Machine Learning Operations ist die Praxis der Zusammenarbeit und Kommunikation zwischen Data Science, IT und dem Unternehmen, um den End-to-End-Lebenszyklus von Machine-Learning-Projekten zu managen”, erklärt Alon Gubkin, CTO und Mitbegründer der Observability-Plattform Aporia. “Bei MLops geht es darum, verschiedene Teams und Abteilungen innerhalb eines Unternehmens zusammenzubringen, um sicherzustellen, dass Machine-Learning-Modelle effektiv eingesetzt und gewartet werden.”

Haben Sie es mit Führungskräften zu tun, die datengetrieben agieren, schlägt Thibaut Gourdel, Technical Product Marketing Manager beim Datenexperten Talend, vor, weitere Details hinzuzufügen: “MLops fördert die Anwendung agiler Softwareprinzipien in ML-Projekten, etwa die Versionskontrolle von Daten und Modellen sowie eine kontinuierliche Datenvalidierung, Testing und Deployment, um Wiederholbarkeit und Zuverlässigkeit von Modellen sowie die Produktivität der Teams zu verbessern.”

Data Scientists finden: So stellen Sie Datenwissenschaftler ein

Data-Science-Praxis: Die besten Tools für Datenwissenschaftler

Data Scientists finden: So stellen Sie Datenwissenschaftler ein

Original Post>