Technologie

RAG (Retrieval-Augmented Generation)

Auf einen Blick

RAG ist eine KI-Architektur, bei der ein Sprachmodell vor der Antwortgenerierung aktuelle Informationen aus einer externen Datenbank (z.B. dem Web) abruft.

Retrieval-Augmented Generation (RAG) ist das technologische Herzstück moderner KI-Suchmaschinen wie Perplexity, Bing Chat und Google AI Overviews. Es löst das Hauptproblem herkömmlicher Large Language Models (LLMs): veraltetes Wissen und Halluzinationen.

Wie RAG funktioniert

TL;DRAnstatt sich nur auf das in den Gewichten gespeicherte, vortrainierte (und potenziell veraltete) Wissen zu verlassen,...

Anstatt sich nur auf das in den Gewichten gespeicherte, vortrainierte (und potenziell veraltete) Wissen zu verlassen, führt RAG bei jeder Nutzeranfrage folgende Schritte aus:

  1. Retrieval (Abruf): Das System nimmt die Frage des Nutzers und sucht in einer Datenbank (meistens einem Suchmaschinen-Index wie dem von Google oder Bing) nach den aktuellsten und relevantesten Dokumenten.
  2. Augmentation (Anreicherung): Die gefundenen Textpassagen (Chunks) aus diesen Dokumenten werden als Kontext zur ursprünglichen Frage des Nutzers hinzugefügt.
  3. Generation (Generierung): Das LLM erhält nun die Frage plus die frischen Fakten und formuliert daraus eine präzise, natürlichsprachliche Antwort, inklusive Quellenangaben.

RAG und KI-Sichtbarkeit

TL;DRFür SEOs und Marketer bedeutet RAG, dass die klassische Suchmaschinen-Indexierung nach wie vor essenziell ist.

Für SEOs und Marketer bedeutet RAG, dass die klassische Suchmaschinen-Indexierung nach wie vor essenziell ist. Wenn Google deine Seite nicht crawlt und indexiert, kann sie im Retrieval-Schritt nicht gefunden werden und somit auch nicht in der generierten KI-Antwort auftauchen. GEO ist im Grunde die Optimierung für den Retrieval- und Augmentation-Schritt dieser Architektur.

Häufige Fragen (FAQ)