Was bedeutet Retrieval Augmented Generation (RAG)?

Glossar/Retrieval Augmented Generation (RAG)

allgemein

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG) ist ein Architekturansatz, bei dem ein Large Language Model (LLM) vor der Antwortgenerierung gezielt relevante Informationen aus einer externen Wissensdatenbank

Retrieval Augmented Generation (RAG) ist ein Architekturansatz, bei dem ein Large Language Model (LLM) vor der Antwortgenerierung gezielt relevante Informationen aus einer externen Wissensdatenbank abruft und in seine Antwort einbezieht. Das Modell kombiniert so sein allgemeines Sprachverständnis mit aktuellen, unternehmensspezifischen Daten.

LLMs haben zwei zentrale Schwächen: Ihr Wissen ist auf den Trainingszeitraum begrenzt, und sie können Halluzination (KI) erzeugen - also Antworten generieren, die plausibel klingen, aber faktisch falsch sind. RAG adressiert beide Probleme, indem es das Modell mit einer aktuellen, verifizierbaren Datenbasis verbindet. Das Ergebnis sind Antworten, die sowohl sprachlich natürlich als auch inhaltlich fundiert und nachvollziehbar sind.

Wie Retrieval Augmented Generation technisch funktioniert

Der RAG-Prozess läuft in drei Schritten ab. Zuerst wird die Nutzerfrage analysiert und in eine semantische Suchanfrage umgewandelt. Dann werden relevante Dokumente aus einer Vektordatenbank oder einem Suchindex abgerufen (Retrieval-Phase). Schliesslich generiert das LLM eine Antwort unter Berücksichtigung der abgerufenen Dokumente (Generation-Phase). Durch diese Kombination entstehen Antworten, die auf konkreten, nachvollziehbaren Quellen basieren und sich verifizieren lassen.

Die Qualität eines RAG-Systems hängt massgeblich von der Aufbereitung der zugrundeliegenden Wissensdatenbank ab. Dokumente müssen sinnvoll in Abschnitte segmentiert, mit Metadaten angereichert und regelmässig aktualisiert werden, damit die semantische Suche tatsächlich relevante Ergebnisse liefert. Schlechte Datenqualität führt auch bei RAG zu schlechten Antworten.

RAG in der Unternehmenspraxis

Für Unternehmen ermöglicht RAG KI-Agent-Systeme, die auf interne Wissensdatenbanken, Produktkataloge, Kundendaten oder Prozessdokumentationen zugreifen können. In Kombination mit MCP (Model Context Protocol) und API (Application Programming Interface)-Anbindungen entstehen intelligente Systeme, die unternehmensinternes Wissen verfügbar machen, ohne sensible Daten ins Modelltraining einzuspeisen. Das ist besonders für DSGVO-konforme Implementierungen im DACH-Raum ein entscheidender Vorteil.

Gutes Prompt Engineering optimiert die Qualität der RAG-Ergebnisse zusätzlich, indem es steuert, wie das Modell abgerufene Informationen priorisiert und verarbeitet.

/webapp konzipiert und entwickelt RAG-basierte Anwendungen für Unternehmen, die ihre internen Daten intelligent und datenschutzkonform nutzbar machen wollen.

Retrieval Augmented Generation (RAG)

Das könnte dich auch interessieren

Conversion Rate Optimization (CRO)

Design System

GraphQL