RAG verstehen: Retrieval Augmented Generation erklärt

Retrieval Augmented Generation (RAG) kombiniert die Stärken von Suchsystemen mit der Sprachfähigkeit von LLMs. Das Ergebnis: akkuratere, aktuellere Antworten.

Das Problem

LLMs haben einen Knowledge Cutoff – sie wissen nur, was bis zu ihrem Training veröffentlicht wurde. Außerdem "halluzinieren" sie manchmal plausibel klingende, aber falsche Informationen.

Die Lösung: RAG

Bei RAG wird die Anfrage zunächst verwendet, um relevante Dokumente aus einer Wissensdatenbank abzurufen. Diese Dokumente werden dann zusammen mit der Anfrage an das LLM übergeben.

Architektur

Dokumente werden in Chunks aufgeteilt und als Embeddings gespeichert
Bei einer Anfrage werden die semantisch ähnlichsten Chunks abgerufen
Die Chunks werden als Kontext in den Prompt eingefügt
Das LLM generiert eine Antwort basierend auf dem Kontext

Anwendungsfälle

RAG eignet sich besonders für Unternehmenswissen, Dokumentation, Kundensupport und jede Anwendung, die aktuelle oder proprietäre Daten benötigt.

RAG verstehen: Retrieval Augmented Generation erklärt

Das Problem

Die Lösung: RAG

Architektur

Anwendungsfälle

Artikel teilen

Gefällt dir dieser Artikel?

Ähnliche Artikel

Der ultimative Prompt Engineering Guide für 2025

Fine-Tuning vs. Prompting: Wann lohnt sich was?

Lokale LLMs: So betreiben Sie KI ohne Cloud

Das Problem

Die Lösung: RAG

Architektur

Anwendungsfälle

Artikel teilen

Gefällt dir dieser Artikel?

Ähnliche Artikel

Der ultimative Prompt Engineering Guide für 2025

Fine-Tuning vs. Prompting: Wann lohnt sich was?

Lokale LLMs: So betreiben Sie KI ohne Cloud

Anmelden