RAG verstehen: Retrieval Augmented Generation erklärt
RAG ist einer der wichtigsten Trends in der KI-Entwicklung. Wir erklären, wie die Technik funktioniert und wann sie sinnvoll ist.
Retrieval Augmented Generation (RAG) kombiniert die Stärken von Suchsystemen mit der Sprachfähigkeit von LLMs. Das Ergebnis: akkuratere, aktuellere Antworten.
Das Problem
LLMs haben einen Knowledge Cutoff – sie wissen nur, was bis zu ihrem Training veröffentlicht wurde. Außerdem "halluzinieren" sie manchmal plausibel klingende, aber falsche Informationen.
Die Lösung: RAG
Bei RAG wird die Anfrage zunächst verwendet, um relevante Dokumente aus einer Wissensdatenbank abzurufen. Diese Dokumente werden dann zusammen mit der Anfrage an das LLM übergeben.
Architektur
- Dokumente werden in Chunks aufgeteilt und als Embeddings gespeichert
- Bei einer Anfrage werden die semantisch ähnlichsten Chunks abgerufen
- Die Chunks werden als Kontext in den Prompt eingefügt
- Das LLM generiert eine Antwort basierend auf dem Kontext
Anwendungsfälle
RAG eignet sich besonders für Unternehmenswissen, Dokumentation, Kundensupport und jede Anwendung, die aktuelle oder proprietäre Daten benötigt.
Gefällt dir dieser Artikel?
Abonniere KI Weekly und erhalte jeden Montag die wichtigsten KI-News.