Workstation oder Cloud?: So machen CIOs ihre Datenexperten produktiver

Kaum ein Berufsfeld ist in den vergangenen Jahren so rasant gewachsen wie das des Data-Scientists. Nahezu jedes Unternehmen arbeitet heute mit großen Datenmengen und steht vor der Herausforderung, daraus Erkenntnisse für aktuelle und zukünftige Geschäftsfelder zu gewinnen.

Source: Workstation oder Cloud?: So machen CIOs ihre Datenexperten produktiver

 Diese Rückschlüsse werden von der Geschäftsleitung oder von Bereichsleitern angefordert und müssen mit hoher Präzision und häufig unter Zeitdruck erstellt werden.

Dafür verwenden Datenexperten komplexe und äußerst rechenintensive Analyse- und Prognose-Modelle. An diesen Modellen verbringen sie rund 80 bis 90 Prozent ihrer Arbeitszeit. Das heißt: Je mehr Rechenleistung einem Data-Scientist an seinem Arbeitsplatz zur Verfügung steht, umso produktiver ist er. Kein Wunder also, dass hier die leistungsstärksten Workstations anzutreffen sind. HP bietet dafür schon seit vielen Jahren mit seiner Z-Serie branchenführende Systeme an. Das Portfolio reicht von der mobilen Workstation ZBook Firefly 14 G8 bis hin zum Flaggschiffmodell, der Hochleistungs-Tower-Workstation Z8 G4.

Gegenwärtig zeichnet sich jedoch ein Trend ab, der die Produktivität der Data-Scientists stark beeinträchtigen kann. Da ist zum einen die “neue Welt des Arbeitens”. Stichwort: Work-from-Home. Viele Unternehmen scheuen sich, auch die Heimarbeitsplätze mit High-Performance-Systemen auszustatten.

Zum anderen verlagern CIOs immer mehr Anwendungen in die Cloud, was bei den daten- und rechenintensiven Anwendungen der Data-Scientists zunächst sinnvoll erscheint – schließlich werden immer mehr Daten direkt nach dem Erfassen in umfangreichen Cloud-basierten Datenmanagement-Systemen gespeichert. Hinzu kommt, dass viele Datenanalysen eine große Leistungsspitze beim Rechenbedarf erfordern. So etwas ist in der Cloud einfacher zu managen als intern. All das spricht dafür, dass auch Data-Scientists direkt in der Cloud arbeiten sollten.

Das stimmt aber nur bis zu einem bestimmten Punkt. Eine optimale “Arbeitsteilung” sieht eher so aus, dass umfangreiche Analysen in der Cloud ablaufen, wogegen die darauf aufbauenden Auswertungen, Visualisierungen und Executive-Summarys lokal auf einer leistungsstarken Workstation erstellt werden. Lokale Grafikprozessoren von Nvidia können dabei helfen, geeignete Alternativen bei der Visualisierung deutlich schneller auszuwählen.

Das bietet zwei Vorteile: Erstens eine höhere Produktivität und zweitens lassen sich durch die Möglichkeit von experimentellen Ausgabeformaten auch Ergebnisse besser darstellen. Gerade die neuesten Workstations sind auf dieses Anforderungsprofil ausgerichtet. Beispielsweise sind die “Z by HP Data Science Workstations” je nach Bedarf vorkonfigurierte Power-Systeme, die eigens für die rechenintensiven Arbeiten von Data-Scientists entwickelt wurden. Sie verfügen über eine optimierte Kombination aus Intel-Prozessoren mit Nvidia Quadro RTX-Grafikkarten und der beschleunigten CUDA-X AI Data Science-Software. Zum Vergleich: Gegenüber einer Mainstream-CPU-Lösungen ist eine Z by HP Data-Science-Desktop-Workstation um den Faktor zehn schneller.

Eine solche Workstation erhöht nicht nur die Produktivität und die Mitarbeiterzufriedenheit, sondern ist in der Regel auch günstiger als eine vergleichbare Cloud-Server-Lösung. Nach HP-Berechnungen amortisiert sich eine Z by HP Workstation bereits nach nur acht Monaten. Dabei ist noch unberücksichtigt, dass die Cloud Kosten allgemein steigen und dass selbst vermeintliche Kostenvorteile nur mit einem ausgefeilten Cloud-Management Tool realisierbar sind. Immer wieder gibt es Meldungen, dass nach einer Analyse eine große Zahl an Compute-Instanzen nicht zurückgegeben wurden und es dann bei der Rechnung eine böse Überraschung gab.

Ganz anders ist die Situation bei dem HP- und Nvidia-Referenzkunden American Airlines (AA). Das Unternehmen bietet neben Passagierflügen auch weltweite Luftfrachtdienste an. Wegen der unterschiedlichen Größen und Gewichte der Pakete müssen viele Variablen analysiert werden, um die Zuladung zu optimieren.

Dabei ist die größte Herausforderung, dass viele gebuchte Zuladungen nicht angeliefert werden. Und da bei der Luftfracht nur das bezahlt wird, was transportiert wurde, können daraus erhebliche Verluste entstehen.

Deshalb nutzt American Airlines komplexe Machine-Learning-Algorithmen, die auf leistungsstarken Z by HP Data Science-Workstations laufen. Diese Algorithmen ermitteln die Wahrscheinlichkeit, ob eine gebuchte Frachtsendung auch angeliefert wird. Das hat die Auslastung deutlich verbessert. Zum Einsatz kommt dabei das Open-Source-Vorhersagemodell H2O4GPU, das für GPU-beschleunigtes maschinelles Lernen entwickelt wurde.

“Mit den Data-Science-Workstations von HP erreichen unsere Vorhersagen eine Genauigkeit von über 90 Prozent”, freut sich Tassio Carvalho, Leiter des Center for Machine Learning and Artificial Intelligence bei American Airlines.

Alles über die Z by HP Workstation erfahren Sie hier.

Leave a Reply