Retrieval-Augmented Generation: Unterschied zwischen den Versionen
Markus (Diskussion | Beiträge) Die Seite wurde neu angelegt: „== Kurzbeschriebung == Beschreibung ist::Retrieval-Augmented Generation (RAG) ist ein hybrider KI-Ansatz, der Informationsabruf (Retrieval) mit generativer Modellierung kombiniert. Anstatt Antworten ausschließlich aus dem internen Modellwissen zu erzeugen, ruft ein RAG-System zunächst relevante externe Informationen (z. B. Dokumente, Datenbankeinträge, Wissensgraphen) ab und nutzt diese anschließend als Kontext für die Text- oder Antwortgenerierun…“ |
Markus (Diskussion | Beiträge) K Textersetzung - „Wikipedia-en-Seite ist::https://en.wikipedia.org/wiki/“ durch „Wikipedia-en-Seite ist::“ |
||
| Zeile 30: | Zeile 30: | ||
]] | ]] | ||
Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist:: | Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist::Retrieval-augmented_generation | ||
]] | ]] | ||
Version vom 3. Februar 2026, 14:25 Uhr
Kurzbeschriebung
Retrieval-Augmented Generation (RAG) ist ein hybrider KI-Ansatz, der Informationsabruf (Retrieval) mit generativer Modellierung kombiniert. Anstatt Antworten ausschließlich aus dem internen Modellwissen zu erzeugen, ruft ein RAG-System zunächst relevante externe Informationen (z. B. Dokumente, Datenbankeinträge, Wissensgraphen) ab und nutzt diese anschließend als Kontext für die Text- oder Antwortgenerierung.
Typischerweise besteht ein RAG-System aus zwei Hauptkomponenten: (1) einem Retriever, der auf Basis einer Anfrage relevante Inhalte identifiziert (häufig mittels Vektorsuche/Embeddings), und (2) einem Generator (meist ein großes Sprachmodell), der die abgerufenen Inhalte in eine kohärente Antwort integriert. Formal lässt sich dies als bedingte Generierung '"`UNIQ--math-00000000-QINU`"' auffassen, wobei '"`UNIQ--math-00000001-QINU`"' die retrievten Dokumente sind.
Der entscheidende Vorteil von RAG liegt in der Entkopplung von Wissen und Sprachmodell: Inhalte können aktualisiert, versioniert und kuratiert werden, ohne das generative Modell neu zu trainieren. Gleichzeitig reduziert RAG das Risiko von Halluzinationen, da Aussagen explizit auf externe Quellen gestützt werden.
RAG ist kein einzelnes Modell, sondern ein Architektur- und Anwendungsmuster, das mit unterschiedlichen Retrievern (Vektordatenbanken, BM25, Graphabfragen) und Generatoren (Transformer-LLMs) umgesetzt werden kann. Qualität und Vertrauenswürdigkeit hängen stark von der Retrieval-Strategie und der Kontextintegration ab.
Anwendbarkeit im Gesundheitssektor
Im Gesundheitswesen wird RAG eingesetzt, um domänenspezifische Wissensbestände (Leitlinien, klinische Handbücher, SOPs, Studien, Patienteninformationen) sicher mit generativen Modellen zu verknüpfen. Typische Anwendungen sind klinische Entscheidungsunterstützung, Dokumentationshilfe oder Frage-Antwort-Systeme für Fachpersonal, bei denen aktuelle und geprüfte Quellen essenziell sind.
In Public Health eignet sich RAG besonders für die Arbeit mit heterogenen, verteilten Wissensquellen, etwa Surveillance-Berichten, Gesetzestexten, Methodendokumentationen oder Forschungsartikeln. Es ermöglicht transparente Analysen, bei denen Antworten mit Quellenbezug erzeugt werden, z. B. für Policy-Briefs, Lageberichte oder evidenzbasierte Kommunikation.
Sonstiges
Qualität stark abhängig vom Retrieval (Recall, Precision, Chunking)
Ermöglicht Quellenangaben und Auditierbarkeit
Kein Garant für Korrektheit – kuratierte Datenbasis entscheidend
Semantik
Wikidata-Identifikator ist: Q121135508
Deutsche Wikipediaseite ist: https://de.wikipedia.org/wiki/Retrieval-augmented_Generation
Englische Wikipediaseite ist: Retrieval-augmented_generation
Quelle: Lewis et al. (2020), Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Behandlung von Unsicherheit in den Ergebnissen der Methode ist implizit
Für die Methode benötigte Datenmenge ist mittel
Zweck der Methode ist Inferenz;Vorhersage;Beschreibende und erkundende Analyse„Inferenz;Vorhersage;Beschreibende und erkundende Analyse“ befindet sich nicht in der Liste (Voraussage, Inferenz, Simulation, Kausale Analyse) zulässiger Werte für das Attribut „Zweck der Methode ist“.
Methode ist Mitglied der Methodenfamilie Hybrid;Maschinelles Lernen;Praktisches Anwendungskonzept„Hybrid;Maschinelles Lernen;Praktisches Anwendungskonzept“ befindet sich nicht in der Liste (Mechanistisch, Statistisch, Maschinenlernen, Tiefes Lernen, Hybrid, Kausale Inferenz, Simulation, Operationale Vorhersage, Beschreibende und erkundende Analyse, Praktisches Anwendungskonzept, ...) zulässiger Werte für das Attribut „Methode ist Mitglied der Methodenfamilie“.
Interpretierbarkeit der Ergebnisse der Methode ist mittel