← Alle Begriffe konzept

RAG (Retrieval-Augmented Generation)

Eine Methode die KI-Modelle mit eigenen Dokumenten fuettert — ohne das Modell neu trainieren zu muessen.

Erklaerung

RAG kombiniert ein Sprachmodell mit einer Wissensdatenbank. Statt das Modell teuer auf eigenen Daten zu trainieren, werden bei jeder Anfrage relevante Dokumente aus einer Datenbank geholt und dem Modell als Kontext mitgegeben. Das Modell antwortet dann basierend auf echten Fakten statt zu halluzinieren. Typische Implementierung: Dokumente werden in Chunks aufgeteilt, als Vektoren gespeichert (Embeddings), und bei einer Anfrage wird per Similarity Search der relevanteste Chunk gefunden und dem Prompt hinzugefuegt.

Beispiel

Frage: 'Wie lautet unsere Rueckgaberichtlinie fuer B2B-Kunden?' → RAG durchsucht das interne Wiki, findet die AGB-Passage, und Claude formuliert eine praezise Antwort basierend auf dem echten Dokument.

Verwandte Begriffe

llm embedding corporate-llm ollama