Was ist Retrieval Augmented Generation (RAG)?



Retrieval Augmented Generation (RAG) kann zu präziseren, aktuelleren und fundierteren GenAI-Outputs beitragen.

Foto: VectorMine | shutterstock.com

In Zusammenhang mit großen Sprachmodellen (auch Large Language Models; LLMs) sorgen zwei Aspekte immer wieder für Probleme:

Retrieval Augmented Generation (RAG) ist gekommen, um diese Problemfelder aufzulösen.

In diesem Artikel lesen Sie, wie sich RAG definiert, inwiefern es zur Problemlösung beiträgt, und wie das konkret auf technischer Ebene funktioniert.

Bei Retrieval Augmented Generation handelt es sich um eine Technik, die den KI-Forschungslaboren von Facebook, respektive Meta entsprungen ist (PDF) und LLMs mit spezifischen Datenquellen "erdet". Dabei handelt es sich in vielen Fällen um Informationen, die nicht in den ursprünglichen Trainingsdatensätzen enthalten waren. Dieser Prozess läuft ganz generell in drei Schritten ab:

  1. Die Informationen werden aus einer spezifischen Quelle gewonnen ("Retrieval");

  2. Anschließend der Prompt mit dem Kontext der Quelle angereichert ("Augmentation");

  3. Bevor dann mit Hilfe des Modells und dem augmentierten Prompt der Output generiert wird ("Generation").

RAG zu implementieren, kann die Ergebnisse, die große Sprachmodelle zu Tage fördern, qualitativ verbessern. Insbesondere dann, wenn dem Basis-LLM aktuelle Informationen fehlen oder es zu halluzinieren beginnt. Allerdings ist der Einsatz von Retrieval Augmented Generation auch kein Garant dafür, dass Large Language Models nicht (mehr) halluzinieren.

Es kostet jede Menge Zeit und Ressourcen, Large Language Models zu trainieren. Manchmal vergehen dabei Monate, in denen hochmoderne Server-GPUs wie Nvidias H100 auf Hochtouren laufen. Die Sprachmodelle per Retraining stets auf dem aktuellen Stand zu halten, ist dabei ein Ding der Unmöglichkeit – trotz der Möglichkeit, das Basismodell auf neueren Daten feinabzustimmen. Denn dieser Prozess bringt manchmal seine eigenen Nachteile mit sich: Beispielsweise können neue Funktionalitäten, die durch die Feinabstimmung Einzug halten, die im Basismodell bereits vorhandenen einschränken.

Wenn Sie ein LLM, das auf Daten aus dem Jahr 2022 trainiert wurde, nach etwas fragen, das im Jahr 2023 stattgefunden hat, gibt es zwei Möglichkeiten:

  • Das Modell stellt fest, dass es die angefragten Informationen nicht kennt. Dann wird es Ihnen typischerweise etwas über seine veralteten Trainingsdaten mitteilen.

  • Das Modell weiß nicht, dass es die Daten nicht kennt. Dann wird es versuchen, eine Antwort auf der Grundlage ähnlicher, historischer Fragen zu liefern – oder es halluziniert.

Um LLM-Halluzinationen zu vermeiden, kann es manchmal hilfreich sein, seinen Prompt mit dem spezifischen Datum eines Ereignisses, eine relevante URL oder ein entsprechendes Dokument anzugeben. Dabei finden diese Zusatzinformationen ihre Grenze, wenn das "Context Limit" des LLM erreicht ist.

Dieses Kontextgrenzen unterscheiden sich von LLM zu LLM. Anthropics "Claude"-Modelle sind dabei Spitzenreiter – sie realisieren Kontextfenster von bis zu 100.000 Token, was etwa 75.000 Wörtern entspricht. Das ist deutlich mehr als die meisten anderen großen Sprachmodelle bieten.

Auf hoher Ebene betrachtet, funktioniert Retrieval Augmented Generation, indem es Sprachmodelle mit einer Internet- oder Dokumentensuche kombiniert. Dabei werden die Probleme, die beide Schritte bei manueller Ausführung verursachen würden, umgangen. Etwa, dass der Output die Kontextgrenze des LLMs überschreitet.

Bestseller No. 1
Mybaby Automatic Soap Dispenser, 1.1 Pound
  • Works With All Liquid Hand Soaps
  • Plays 20 Second Song That Teaches Children How To...
  • Motion Sensor Technology Provides Sanitary,...
  • Magnetically Attached Drip Tray Removes Easily For...
  • Self-cleaning Function Prevents Clogs And Mess
SaleBestseller No. 2
Asterom Walking Cane - Handmade Wolf Cane - Cool Walking Canes for Men and Women - Wooden, Carved, Unique - Walking Sticks for Men & Seniors (36 Inch)
  • STYLISH CANE FROM THE RED CARPET TO YOUR HOME! Our...
  • 100% SATISFACTION GUARANTEED! Buy with confidence,...
  • EXCEPTIONAL COMFORT DUE TO ERGONOMIC HANDLE. The...
  • CHOOSE THE CORRECT LENGTH TO AVOID SPINE PAIN....
  • WIDE QUAD CANE TIP COMPATIBLE. Need extra...

Bezogen auf die weiter oben vorgestellten drei Schritte des RAG-Prozesses hier noch einmal die technischen Abläufe der einzelnen Phasen:

  • Retrieval: Eine Internet-, Dokumenten- oder Datenbanksuche wird genutzt, um Quellinformationen in eine dichte, hochdimensionale Form zu vektorisieren. Typischerweise geschieht das, indem ein Einbettungsvektor erzeugt und in einer Vektordatenbank gespeichert wird.

  • Augmentation: Dann wird die Abfrage selbst vektorisiert und mit Hilfe von FAISS oder anderen Suchtechniken (typischerweise unter Verwendung einer Cosinus-Metrik für die Ähnlichkeit) mit der Vektordatenbank abgeglichen. So werden die relevantesten Teile der Quellinformationen extrahiert und dem LLM zusammen mit dem Query-Text präsentiert.

  • Generation: Schließlich generiert das LLM eine Antwort.

Das hört sich möglicherweise kompliziert an – in der Praxis resultiert das allerdings lediglich in fünf Zeilen Python-Code (wenn Sie das LangChain-Framework zu Orchestrierungszwecken verwenden):

from langchain.document_loaders import WebBaseLoader

from langchain.indexes import VectorstoreIndexCreator

loader = WebBaseLoader("https://www.promptingguide.ai/techniques/rag")

New
KDF Straight Leg Jeans for Women High Waisted Jeans Frayed Baggy Pants Raw Hem Loose Stretchy Cropped Wide Leg Jeans Black Size 10
  • Straight Leg Jeans with Raw Trim Hem: These high...
  • The Silhouette of Womens Straight Leg Jeans: The...
  • The Style of Wide Leg Jeans for Women: The novel...
  • For Every Occasion: Whether it's a casual hangout...
  • Care Instructions & Size for Womens Jeans:...
New
Hip Hop Graphic Hoodie for Men Women,Cotton Pullover Loose Unisex Sweatshirt,Stylish Perfect Solid Color Streetwear
  • Solid Hoodie: This versatile hoodie is a must-have...
  • Oversized Comfort: The relaxed fit and oversized...
  • Letter Graphic: The fashion letter graphics on...
  • Suitable for All Occasions: This hoodie is perfect...
  • Quality Materials: Made with a soft and breathable...
New
Plus Size Dresses for Curvy Women, Summer Dresses 2024 Wedding Guest Vacation Party, Womens Boho Floral Dress Casual Flowy Maxi with Sleeves
  • plus size dresses for curvy women plus size summer...
  • plus size casual dresses plus size wedding guest...
  • vacation dresses for women 2024 party dresses for...
  • floral wedding guest dress floral dresses for...
  • flowy maxi dresses for women flowy summer dresses...
New
JIAYOUYA Womens 2024 Tankini Swimsuit Tummy Control Flowy Swimwear Two Piece Bathing Suits Swim Tank Top with Boyshorts A-Black
  • 👙【Tankini Tank Top】: Two piece bathing...
  • 👙【Boyshorts Bottom】: Sporty and flexible...
  • 👙【Removable Padded】: The athletic two piece...
  • 👙【Variety of Wearing】: 2 piece swimsuit top...
  • 👙【Occasion】: Women tankini and shorts...

index = VectorstoreIndexCreator().from_loaders([loader])

index.query("What is RAG?")

New
Rose Quartz Agate | Serving Tray with Brass Handles | Circular (Gold - Finish), Diameter(12 inch)
  • The natural look of agate stone creates a unique...
  • The edges of each piece are electroplated (NOT...
  • Handles are solid brass.
  • Available in 12", 14" and 16" diameter
  • Can do silver, rose gold, or gold plating for...
New
AANTHROPOLOGY By Rhea White Crystal Agate Cheese Platter/Tray | Circular (Gold - Finish), Diameter(12 inches)
  • The natural look of agate stone creates a unique...
  • The edges of each piece are electroplated (NOT...
  • Handles are solid brass.
  • Available in 12", 14" and 16" diameter
  • Can do silver, rose gold, or gold plating for...
New
Magenta Agate Aventurine Set of 4 Large Coasters/Sign Boards (Rose Gold - Finish)
  • Sold as a set of 4 pieces
  • 4" x 4"
  • 10 - 12 mm thick
  • Natural stone will vary in size, color, and...
  • Each piece has 4 rubber pads to avoid scratching...

(fm)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.

Original Post>

Leave a Reply