Question 1

Was ist RAG?

Accepted Answer

Das RAG (Retrieval-Augmented Generation, oder durch Abruf augmentierte Generierung) ist eine Architektur, die Informationssuche und Generierung durch ein LLM kombiniert. Statt aus seinen alleinigen Parametern zu antworten, erhält das LLM in seinem Prompt die relevanten Passagen einer internen Dokumentenbasis — was die Antwort auf verifizierte Quellen verankert und Halluzinationen drastisch reduziert.

Question 2

Warum RAG statt eines rohen LLM verwenden?

Accepted Answer

Drei Gründe: (1) ein alleiniges LLM ignoriert alles, was nach seinem Training passiert ist (Knowledge cutoff), (2) ein alleiniges LLM kennt nicht die internen Daten Ihres Unternehmens, (3) ohne zu zitierende Quelle erfindet ein LLM plausibel (Halluzinationen). Das RAG löst diese drei Probleme: aktuelle Quellen, beherrschte private Daten, beglaubigbare Antworten.

Question 3

Unterschied zwischen RAG und Fine-Tuning?

Accepted Answer

Das RAG ruft dynamisch den relevanten Kontext bei jeder Frage ab — flexibel, leicht zu aktualisieren, beglaubigt. Das Fine-Tuning passt die Gewichte des Modells an eine Domäne an — besser für den Ton, das Format oder sehr spezifische Aufgaben, aber kostspielig im Training und in der Aktualisierung. Die beiden sind komplementär: die Mehrheit der ernsthaften Bereitstellungen kombiniert RAG auf Geschäftsdaten und leichtes Fine-Tuning auf das Antwortformat.

Question 4

Was sind die Fallen des RAG in Produktion?

Accepted Answer

Sieben wiederkehrende Wachsamkeitspunkte: die Qualität des Chunking, die Wahl der an die Domäne angepassten Embeddings, der Reichtum der Metadaten zum Filtern, die Berücksichtigung der Benutzerberechtigungen (oft vergessen), die Einrichtung eines eigenen Eval-Sets, die Inferenzkosten im großen Maßstab und die Strategie der Neuindexierung zur Verwaltung der Aktualisierungen. Ein RAG, das in der Demo funktioniert und in Produktion bricht, scheitert fast immer an einem dieser Punkte.

RAG — IT-Definition

Warum RAG existiert

Wie eine RAG-Pipeline funktioniert

RAG-Varianten

RAG vs. Fine-Tuning vs. langer Kontext

Herausforderungen des RAG in Produktion

RAG und SI-Kontext

Gängige RAG-Werkzeuge

Häufig gestellte Fragen

Was ist RAG?

Warum RAG statt eines rohen LLM verwenden?

Unterschied zwischen RAG und Fine-Tuning?

Was sind die Fallen des RAG in Produktion?

Alle Begriffe

5R-Methode

8R-Methode

Anwendung

Architektur

Brauchen Sie Hilfe bei der Kartierung Ihrer IT-Landschaft?