Random Forests®
Random forests de breiman and cutler
Com base na coleta das árvores de classificação e regressão (CART®), o mecanismo de modelamento Random Forests® soma as previsões feitas de cada árvore CART para determinar a previsão geral da floresta, garantindo que as árvores de decisão não influenciem umas às outras.
Para quem não conhece o Random Forests, ele é uma técnica de conjunto poderosa desenvolvida por Leo Breiman e Adele Cutler na University of California, Berkeley, e é um dos favoritos de muitos profissionais de modelagem preditiva. A aparente simplicidade do algoritmo cria centenas de árvores independentes e emprega muitas amostras de observações e variáveis.
A capacidade exclusiva do Random Forests de avaliar o desempenho do modelo sem viés com base em dados torna desnecessário separar o teste ou a validação separada. Isso posiciona imediatamente o Random Forests como a ferramenta de modelagem preditiva principal nos aplicativos de dados amplos quando o número de variáveis ultrapassa, com frequência em muitas vezes, o número de observações disponíveis.
Responsabilidade
O Random Forests tem a capacidade exclusiva de aproveitar cada registro no conjunto de dados sem perigo de sobreajuste. Isso é especialmente importante para conjuntos de dados pequenos (em termos de observações), em que cada registro possa contribuir com algo de valor. O Random Forests garantirá que todos os registros sejam considerados para seus modelos e nenhum insight simples seja perdido.
Importância da variável robusta
O Random Forests utiliza novas técnicas para classificar preditores de acordo com sua importância. Isso é conveniente quando os dados incluem milhares, dezenas ou mesmo centenas de milhares de variáveis de preditores, que está bem além do alcance das ferramentas convencionais de regressão e classificação. O Random Forest pode lidar com tais situações extremas e relatar quais variáveis usar nas pesquisas de acompanhamento. Várias rodadas de amostragem adicionarão robustez e qualidade a esses insights.
Tem interesse em experimentar o mecanismo de modelamento: Random Forests?
Métodos baseados em árvore da Minitab
Se estiver apenas começando ou procurando melhorar seus recursos de análise preditiva, os mecanismos de modelamento baseados em árvore têm o poder de que você precisa.
Saiba mais sobre todas as soluções de análise preditiva da Minitab
CART®
O algoritmo definitivo de árvore de classificação que revolucionou a análise avançada e inaugurou a era atual de ciência de dados.
Random Forests®
O poder para aproveitar várias análises alternativas, estratégias de aleatorização e aprendizagem em conjunto em um local conveniente.
TreeNet®
A ferramenta de aprendizado de máquina mais flexível e poderosa é aquela capaz de gerar consistentemente modelos muito precisos.