Random Forests®

Random forests de breiman and cutler

Com base na coleta das árvores de classificação e regressão (CART®), o mecanismo de modelamento Random Forests® soma as previsões feitas de cada árvore CART para determinar a previsão geral da floresta, garantindo que as árvores de decisão não influenciem umas às outras.

Para quem não conhece o Random Forests, ele é uma técnica de conjunto poderosa desenvolvida por Leo Breiman e Adele Cutler na University of California, Berkeley, e é um dos favoritos de muitos profissionais de modelagem preditiva. A aparente simplicidade do algoritmo cria centenas de árvores independentes e emprega muitas amostras de observações e variáveis.

A capacidade exclusiva do Random Forests de avaliar o desempenho do modelo sem viés com base em dados torna desnecessário separar o teste ou a validação separada. Isso posiciona imediatamente o Random Forests como a ferramenta de modelagem preditiva principal nos aplicativos de dados amplos quando o número de variáveis ultrapassa, com frequência em muitas vezes, o número de observações disponíveis.

Play Video
video-altText

Responsabilidade

O Random Forests tem a capacidade exclusiva de aproveitar cada registro no conjunto de dados sem perigo de sobreajuste. Isso é especialmente importante para conjuntos de dados pequenos (em termos de observações), em que cada registro possa contribuir com algo de valor. O Random Forests garantirá que todos os registros sejam considerados para seus modelos e nenhum insight simples seja perdido.

Importância da variável robusta

O Random Forests utiliza novas técnicas para classificar preditores de acordo com sua importância. Isso é conveniente quando os dados incluem milhares, dezenas ou mesmo centenas de milhares de variáveis de preditores, que está bem além do alcance das ferramentas convencionais de regressão e classificação. O Random Forest pode lidar com tais situações extremas e relatar quais variáveis usar nas pesquisas de acompanhamento. Várias rodadas de amostragem adicionarão robustez e qualidade a esses insights.

Tem interesse em experimentar o mecanismo de modelamento: Random Forests?

Métodos baseados em árvore da Minitab

Se estiver apenas começando ou procurando melhorar seus recursos de análise preditiva, os mecanismos de modelamento baseados em árvore têm o poder de que você precisa. 

Saiba mais sobre todas as soluções de análise preditiva da Minitab

CART

CART®

O algoritmo definitivo de árvore de classificação que revolucionou a análise avançada e inaugurou a era atual de ciência de dados.

Random Forests

Random Forests®

O poder para aproveitar várias análises alternativas, estratégias de aleatorização e aprendizagem em conjunto em um local conveniente.

TreeNet®

A ferramenta de aprendizado de máquina mais flexível e poderosa é aquela capaz de gerar consistentemente modelos muito precisos.

Tudo pronto para descobrir as soluções de análise preditiva da Minitab?