Random Forests®
Random forests von breiman und cutler
Auf der Grundlage einer Sammlung von Klassifikations- und Regressionsbäumen (CART®) fasst das Random Forests®-Modellierungsmodul die Prognosen der einzelnen CART-Bäume zusammen, um die Gesamtprognose des Walds zu bestimmen. Gleichzeitig wird sichergestellt, dass die einzelnen Entscheidungsbäume sich nicht gegenseitig beeinflussen.
Random Forests ist ein leistungsstarkes Ensemble-Verfahren, das von Leo Breiman und Adele Cutler an der University of California in Berkeley entwickelt wurde. Es ist bei vielen Experten im Bereich prädiktive Modellerstellung die erste Wahl. Der scheinbar einfache Algorithmus erstellt Hunderte von unabhängigen Bäumen und zieht eine Vielzahl von Stichproben aus Beobachtungen und Variablen.
Durch die einzigartige Fähigkeit von Random Forests, eine nicht verzerrte Modellleistung auf der Grundlage von Daten außerhalb des Segments auszuwerten, ist keine separate Stichprobe zum Testen und für die Validierung erforderlich. Dies positioniert Random Forests als Werkzeug für Prognosemodelle ganz vorne unter den vielen Datenanwendungen, bei denen die Anzahl der Variablen die Anzahl der verfügbaren Beobachtungen oft um ein Vielfaches übersteigt.
Verantwortung
Random Forests bietet eine einzigartige Möglichkeit, jeden Eintrag in einem Datensatz zu nutzen, ohne eine übermäßige Anpassung zu riskieren. Dies ist insbesondere für kleine Datensätze mit wenigen Beobachtungen von Bedeutung, bei denen jeder Eintrag wichtig sein kann. Mit Random Forests wird sichergestellt, dass alle Einträge in Ihren Modellen berücksichtigt werden und keine Einblicke übersehen werden.
Robuste Variablenwichtigkeit
Random Forests nutzt neue Verfahren, um Prädiktoren gemäß ihrer Wichtigkeit zu sortieren. Dies ist hilfreich, wenn die Daten Tausende oder sogar Hunderttausende von Variablen oder Prädiktoren enthalten, was die Kapazität von herkömmlichen Regressions- und Klassifikationsbäumen bei Weitem überschreitet. Random Forests kann mit diesen Extremsituationen umgehen und erkennen, welche Variablen bei der weiteren Analyse verwendet werden sollten. Die Robustheit und Qualität dieser Ergebnisse wird durch mehrere Runden mit Stichprobenziehung gesteigert.
Baumbasierte Verfahren von Minitab
Ob Sie gerade erst anfangen oder intensiver mit prädiktiven Analysen arbeiten möchten, die baumbasierten Modellierungsmodule von Minitab bieten Ihnen alles, was Sie brauchen.
Weitere Informationen zu den Minitab-Lösungen für prädiktive Analysen
CART®
Der ultimative Algorithmus für Klassifikationsbäume, der komplexe Analysen revolutioniert und das heutige Zeitalter der Datenwissenschaft eingeläutet hat.
Random Forests®
Dieses Modul bietet an einem zentralen Ort die Leistungsstärke von verschiedenen alternativen Analysen, Randomisierungsstrategien und Ensemble Learning.
TreeNet®
Das flexibelste und leistungsstärkste Werkzeug für maschinelles Lernen, mit dem zuverlässig extrem präzise Modelle erstellt werden können.