Retrieval-Augmented Generation: Unterschied zwischen den Versionen

Aus Kyffhäuser KI
Zur Navigation springen Zur Suche springen
Die Seite wurde neu angelegt: „== Kurzbeschriebung == Beschreibung ist::Retrieval-Augmented Generation (RAG) ist ein hybrider KI-Ansatz, der Informationsabruf (Retrieval) mit generativer Modellierung kombiniert. Anstatt Antworten ausschließlich aus dem internen Modellwissen zu erzeugen, ruft ein RAG-System zunächst relevante externe Informationen (z. B. Dokumente, Datenbankeinträge, Wissensgraphen) ab und nutzt diese anschließend als Kontext für die Text- oder Antwortgenerierun…“
 
K Textersetzung - „[[Wikipedia-de-Seite ist::https://de.wikipedia.org/wiki/“ durch „[[Wikipedia-de-Seite ist::“
 
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt)
Zeile 27: Zeile 27:
Wikidata-Identifikator ist: [[Wikidata ID ist::Q121135508]]
Wikidata-Identifikator ist: [[Wikidata ID ist::Q121135508]]


Deutsche Wikipediaseite ist: [[Wikipedia-de-Seite ist::https://de.wikipedia.org/wiki/Retrieval-augmented_Generation
Deutsche Wikipediaseite ist: [[Wikipedia-de-Seite ist::Retrieval-augmented_Generation
]]
]]


Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist::https://en.wikipedia.org/wiki/Retrieval-augmented_generation
Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist::Retrieval-augmented_generation
]]
]]



Aktuelle Version vom 3. Februar 2026, 15:52 Uhr

Kurzbeschriebung

Retrieval-Augmented Generation (RAG) ist ein hybrider KI-Ansatz, der Informationsabruf (Retrieval) mit generativer Modellierung kombiniert. Anstatt Antworten ausschließlich aus dem internen Modellwissen zu erzeugen, ruft ein RAG-System zunächst relevante externe Informationen (z. B. Dokumente, Datenbankeinträge, Wissensgraphen) ab und nutzt diese anschließend als Kontext für die Text- oder Antwortgenerierung.

Typischerweise besteht ein RAG-System aus zwei Hauptkomponenten: (1) einem Retriever, der auf Basis einer Anfrage relevante Inhalte identifiziert (häufig mittels Vektorsuche/Embeddings), und (2) einem Generator (meist ein großes Sprachmodell), der die abgerufenen Inhalte in eine kohärente Antwort integriert. Formal lässt sich dies als bedingte Generierung '"`UNIQ--math-00000000-QINU`"' auffassen, wobei '"`UNIQ--math-00000001-QINU`"' die retrievten Dokumente sind.

Der entscheidende Vorteil von RAG liegt in der Entkopplung von Wissen und Sprachmodell: Inhalte können aktualisiert, versioniert und kuratiert werden, ohne das generative Modell neu zu trainieren. Gleichzeitig reduziert RAG das Risiko von Halluzinationen, da Aussagen explizit auf externe Quellen gestützt werden.

RAG ist kein einzelnes Modell, sondern ein Architektur- und Anwendungsmuster, das mit unterschiedlichen Retrievern (Vektordatenbanken, BM25, Graphabfragen) und Generatoren (Transformer-LLMs) umgesetzt werden kann. Qualität und Vertrauenswürdigkeit hängen stark von der Retrieval-Strategie und der Kontextintegration ab.

Anwendbarkeit im Gesundheitssektor

Im Gesundheitswesen wird RAG eingesetzt, um domänenspezifische Wissensbestände (Leitlinien, klinische Handbücher, SOPs, Studien, Patienteninformationen) sicher mit generativen Modellen zu verknüpfen. Typische Anwendungen sind klinische Entscheidungsunterstützung, Dokumentationshilfe oder Frage-Antwort-Systeme für Fachpersonal, bei denen aktuelle und geprüfte Quellen essenziell sind.

In Public Health eignet sich RAG besonders für die Arbeit mit heterogenen, verteilten Wissensquellen, etwa Surveillance-Berichten, Gesetzestexten, Methodendokumentationen oder Forschungsartikeln. Es ermöglicht transparente Analysen, bei denen Antworten mit Quellenbezug erzeugt werden, z. B. für Policy-Briefs, Lageberichte oder evidenzbasierte Kommunikation.

Sonstiges

Qualität stark abhängig vom Retrieval (Recall, Precision, Chunking)

Ermöglicht Quellenangaben und Auditierbarkeit

Kein Garant für Korrektheit – kuratierte Datenbasis entscheidend

Semantik

Wikidata-Identifikator ist: Q121135508

Deutsche Wikipediaseite ist: Retrieval-augmented_Generation

Englische Wikipediaseite ist: Retrieval-augmented_generation

Quelle: Lewis et al. (2020), Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Behandlung von Unsicherheit in den Ergebnissen der Methode ist implizit

Für die Methode benötigte Datenmenge ist mittel

Zweck der Methode ist Inferenz;Vorhersage;Beschreibende und erkundende Analyse„Inferenz;Vorhersage;Beschreibende und erkundende Analyse“ befindet sich nicht in der Liste (Voraussage, Inferenz, Simulation, Kausale Analyse) zulässiger Werte für das Attribut „Zweck der Methode ist“.

Methode ist Mitglied der Methodenfamilie Hybrid;Maschinelles Lernen;Praktisches Anwendungskonzept„Hybrid;Maschinelles Lernen;Praktisches Anwendungskonzept“ befindet sich nicht in der Liste (Mechanistisch, Statistisch, Maschinenlernen, Tiefes Lernen, Hybrid, Kausale Inferenz, Simulation, Operationale Vorhersage, Beschreibende und erkundende Analyse, Praktisches Anwendungskonzept, ...) zulässiger Werte für das Attribut „Methode ist Mitglied der Methodenfamilie“.

Interpretierbarkeit der Ergebnisse der Methode ist mittel

Webseite: https://ai.facebook.com/research/publications/retrieval-augmented-generation-for-knowledge-intensive-nlp-tasks/