Random Forrest: Unterschied zwischen den Versionen
Markus (Diskussion | Beiträge) K Textersetzung - „Wikipedia-en-Seite ist::https://en.wikipedia.org/wiki/“ durch „Wikipedia-en-Seite ist::“ |
Markus (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
| (Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt) | |||
| Zeile 23: | Zeile 23: | ||
== Semantik == | == Semantik == | ||
Wikidata-Identifikator ist: [[Wikidata ID ist:: | Wikidata-Identifikator ist: [[Wikidata ID ist::Q245748]] | ||
Deutsche Wikipediaseite ist: [[Wikipedia-de-Seite ist:: | Deutsche Wikipediaseite ist: [[Wikipedia-de-Seite ist::Random Forest | ||
]] | ]] | ||
Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist:: | Englische Wikipediaseite ist: [[Wikipedia-en-Seite ist::Random forest | ||
]] | ]] | ||
| Zeile 35: | Zeile 35: | ||
Behandlung von Unsicherheit in den Ergebnissen der Methode ist [[Behandlung von Unsicherheit in den Ergebnissen der Methode ist::implizit]] | Behandlung von Unsicherheit in den Ergebnissen der Methode ist [[Behandlung von Unsicherheit in den Ergebnissen der Methode ist::implizit]] | ||
Für die Methode benötigte Datenmenge ist [[Für die Methode benötigte Datenmenge ist:: | Für die Methode benötigte Datenmenge ist [[Für die Methode benötigte Datenmenge ist::groß]] | ||
Zweck der Methode ist [[Zweck der Methode ist:: | Zweck der Methode ist [[Zweck der Methode ist::Voraussage]], [[Zweck der Methode ist::Inferenz]] | ||
Methode ist Mitglied der Methodenfamilie [[Methode ist Mitglied der Methodenfamilie:: | Methode ist Mitglied der Methodenfamilie [[Methode ist Mitglied der Methodenfamilie::Maschinenlernen]], [[Methode ist Mitglied der Methodenfamilie::Hybrid]] | ||
Interpretierbarkeit der Ergebnisse der Methode ist [[Interpretierbarkeit der Ergebnisse der Methode ist::mittel | Interpretierbarkeit der Ergebnisse der Methode ist [[Interpretierbarkeit der Ergebnisse der Methode ist::mittel]] | ||
Webseite: [[Webseiten-URL ist::https://www.stat.berkeley.edu/~breiman/RandomForests/ | Webseite: [[Webseiten-URL ist::https://www.stat.berkeley.edu/~breiman/RandomForests/ | ||
Aktuelle Version vom 3. Februar 2026, 17:00 Uhr
Kurzbeschriebung
Random Forest ist ein ensemblebasiertes maschinelles Lernverfahren, das aus einer großen Anzahl von Entscheidungsbäumen besteht, die jeweils auf zufälligen Teilmengen der Daten und der Prädiktoren trainiert werden. Die Vorhersage erfolgt durch Aggregation der Einzelergebnisse (Mehrheitsvotum bei Klassifikation, Mittelwert bei Regression).
Die zentrale Idee ist die Reduktion von Varianz gegenüber einzelnen Entscheidungsbäumen: Durch Bagging (Bootstrap Aggregating) und zufällige Merkmalsauswahl pro Knoten werden Bäume entkoppelt, sodass Überanpassung effektiv reduziert wird. Jeder Baum ist für sich ein schwacher Lerner, das Ensemble jedoch ein starker Prädiktor.
Random Forests sind nichtparametrisch, können hochdimensionale und nichtlineare Zusammenhänge abbilden und benötigen keine explizite Modellannahme über die Datenverteilung. Sie liefern zusätzlich Maße der Variablenwichtigkeit, sind jedoch keine kausalen Modelle.
Anwendbarkeit im Gesundheitssektor
Im Gesundheitswesen und Public Health werden Random-Forest-Modelle häufig für Risikoprädiktion, Klassifikation und Prognose eingesetzt, etwa zur Vorhersage von Krankheitsrisiken, Komplikationen, Wiederaufnahmen oder Mortalität auf Individual- oder Populationsebene.
Sie sind besonders nützlich bei großen, heterogenen Datensätzen (Register-, EHR-, Surveillance-Daten), in denen komplexe Wechselwirkungen und Nichtlinearitäten auftreten. Random Forests dienen oft als leistungsstarke Vergleichs- oder Ensemble-Komponente, weniger als erklärendes Modell.
Sonstiges
Sehr robust gegenüber Ausreißern und Überanpassung
Kann mit gemischten Datentypen umgehen
Eingeschränkte Interpretierbarkeit einzelner Effekte
Semantik
Wikidata-Identifikator ist: Q245748
Deutsche Wikipediaseite ist: Random Forest
Englische Wikipediaseite ist: Random forest
Quelle: Breiman, L. (2001), Random Forests
Behandlung von Unsicherheit in den Ergebnissen der Methode ist implizit
Für die Methode benötigte Datenmenge ist groß
Zweck der Methode ist Voraussage, Inferenz
Methode ist Mitglied der Methodenfamilie Maschinenlernen, Hybrid
Interpretierbarkeit der Ergebnisse der Methode ist mittel
Webseite: https://www.stat.berkeley.edu/~breiman/RandomForests/