Kontrollierte statt riskanter Intelligenz



ChatGPT, Dall-E, Midjourney und Co. haben die Möglichkeiten der generativen KI aufgezeigt. ChatGPT hat mittlerweile sogar das bayerische Abitur 2023 „bestanden“. Der Erfolg generativer KI-Lösungen beruht auf sogenannten Foundation-Modellen, die nach dem Training eine Vielzahl von Aufgaben erfüllen können. Das unterscheidet sie von früheren KI-Systemen, die sich meist nur für eine eng umrissene Aufgabe eigneten. Für den Unternehmenseinsatz sind sie aufgrund von Schwächen in drei Bereichen jedoch nur bedingt geeignet: So mangelt es vielen Systemen an Vertrauenswürdigkeit der Trainingsdaten und objektiver Nachvollziehbarkeit der Ergebnisse sowie an Energieeffizienz und an der Portabilität der Systeme zwischen verschiedenen Clouds und privaten Umgebungen. Um generative KI-Basismodelle trotz dieser Schwachpunkte sicher im Businesseinsatz nutzen zu können, müssen kommerziell eingesetzte KI-Systeme wie IBM Watsonx diese drei Schwachpunkte adressieren.

Die Basis: Vertrauenswürdigkeit schaffen

Open-Source-KI-Modelle wie Bloom oder Googles PaLM mit Hunderten von Milliarden Parametern sind vielseitig einsetzbar, wurden jedoch mit allgemeinen Daten aus dem Internet trainiert. Firmen sollten ihre KI-Entscheidungen hingegen auf unternehmensrelevante Daten und nicht z.B. auf zufällige Threads auf Reddit stützen. Wenn ein KI-Modell von Anfang an mit qualitativ hochwertigen Daten, vorzugsweise den eigenen Unternehmensdaten, gefüttert wird, entstehen viele Probleme gar nicht erst.

Ein Mangel an realen Daten kann hierbei durch den Einsatz synthetischer Daten behoben werden. Sie ergänzen oder ersetzen echte Daten, um die Zuverlässigkeit des Modells zu verbessern. Training und Tuning sind weitere Schritte beim Aufbau eines vertrauenswürdigen Modells. Das Lernen mit menschlichem Feedback (Reinforcement Learning with Human Feedback, RLHF) trainiert Modelle für sicherere und natürlichere Dialoge. Darüber hinaus sollten Unternehmen Bibliotheken fertig kuratierter und trainierter Basismodelle nutzen, deren Daten bereits gefiltert und bereinigt wurden.

 

Mehr Effizienz: Ressourcenverbrauch von KI reduzieren

Große KI-Modelle mit einer hohen Anzahl von Parametern leisten typischerweise bessere Arbeit als kleinere Modelle. Doch dieser Vorteil ist mit enormen Kosten verbunden und die benötigte Rechenleistung produziert große Mengen CO2. Leistungsfähige KI-Modelle können allerdings kleiner werden, als sie es heute sind: Das Forschungsprojekt Deepmind zeigte, dass ein kleineres, energiesparendes Modell, das mit mehr Daten trainiert wurde, ein viermal so großes Modell, das mit weniger Daten trainiert wurde, übertreffen kann.

Eine weitere potenzielle Energieeinsparung liegt darin, KI-Modelle aufeinander aufbauen zu lassen. Ein KI-Modell kann viermal schneller trainiert werden, indem man die Parameter seiner früheren Version wiederverwendet, z.B. mithilfe des „LiGO“-Algorithmus. Er analysiert die Parametergewichtung des früheren Modells und lernt, wie man es „wachsen“ lässt. Dann überträgt er die gelernte Gewichtung auf das größere Modell – das spart 40 bis 70 Prozent der Kosten, Zeit und CO2-Emissionen, die sonst für das Training anfallen.

Portabilität: KI-Workloads in der Cloud verlagern

Cloud-Plattformen teilen (KI-)Arbeitslasten auf und verarbeiten sie parallel, das beschleunigt Training und Inferenz. Viele Unternehmen führen KI-Workloads aber auf privaten Systemen aus, um vertrauliche Daten zu schützen. Künftig sind daher offene, vollständig Cloud-native Software-Stacks nötig, die KI-Modelle überall ausführen können: in beliebigen Clouds und auf lokal laufenden KI-Systemen. Unternehmen, die ihre Daten hausintern speichern, können ihre Modelle dann auf Wunsch auch vor Ort trainieren und anpassen und vermeiden zudem einen Vendor-Lock-in.

 

Entscheidend ist, dass die anfangs genannten drei Hauptproblemfelder adressiert werden. Nach dem Siegeszug durch Öffentlichkeit und Medien können generative KI-Systeme dann nicht nur in simulierten Abiturprüfungen ihre Leistungsfähigkeit beweisen. Sie werden dann auch fit für den vertrauenswürdigen Einsatz in Firmen und Institutionen.

 

Original Post>