Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
projetos:modeltrees [2008/04/27 10:51] joel |
projetos:modeltrees [2008/11/07 19:24] (atual) joel |
||
---|---|---|---|
Linha 7: | Linha 7: | ||
*[[pessoais:camila|Camila Epprechet]] | *[[pessoais:camila|Camila Epprechet]] | ||
+ | | ||
+ | *[[pessoais:taconeli|César Taconeli]] | ||
+ | | ||
+ | *[[pessoais:paulojus|Paulo Justiniano]] | ||
*[[pessoais:alvaro|Alvaro Veiga]] | *[[pessoais:alvaro|Alvaro Veiga]] | ||
Linha 21: | Linha 25: | ||
===== Introdução ===== | ===== Introdução ===== | ||
- | Os modelos estruturados por árvores, também conhecidos como árvores de decisão, podem ser vistos como métodos não paramétricos de regressão. O princípio destes modelos é o particionamento recursivo do espaço das variáveis e o ajuste de modelos simples em cada partição. | + | As Árvores de Classificação e Regressão compõem um conjunto de métodos de particionamento recursivo que geram regras de decisão para problemas de classificação e regressão que podem ser facilmente interpretadas. Algoritmos como o CHAID, CART, QUEST e C4.5, dentre outros, popularizaram estes métodos em várias comunidades científicas. |
- | Devido a fácil interpretação gerada por este modelo seu uso tornou-se comum em diferentes áreas como: medicina diagnóstica, escoragem de crédito e classificação de populações. | + | O grande poder preditivo destes métodos foi comprovado nas tradicionais competições KDD nas quais diversas metodologias exploratórias de dados concorrem para extração de conhecimento em diferentes bases. Mais recentemente, métodos de boosting e bagging potencializaram ainda mais o uso destes métodos. |
- | Quando a variável resposta é uma classe, estes modelos são denominados árvores de classificação e quando ela é contínua, são chamados árvores de regressão. | ||
- | |||
- | Muitos algoritmos foram desenvolvidos para realizar o particionamento recursivo, dentre eles: CHAID, CART, QUEST, C4.5,... | ||
- | |||
- | Uma das desvantagens destes algoritmos é a instabilidade do modelo final. Pequenas mudanças na base de dados pode gerar diferentes modelos. Por este motivo, são adotadas saídas como Bagging e Boosting para problemas que a finalidade é preditiva. | ||
==== Artigos ==== | ==== Artigos ==== | ||
Linha 40: | Linha 39: | ||
* {{projetos:modeltree:a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}} | * {{projetos:modeltree:a-comparison-of-logistic.pdf|Comparação Regressão Logística x Árvore de Decisão}} | ||
* {{projetos:modeltree:cart_area_medica.pdf|Aplicação do CART na Área Médica}} | * {{projetos:modeltree:cart_area_medica.pdf|Aplicação do CART na Área Médica}} | ||
+ | ==== Trabalhos Acadêmicos ==== | ||
- | ==== Programas ==== | + | |
+ | {{:projetos:modeltrees:tese_bernardo_v10.doc|Dissertação de Mestrado de Bernardo Spindel}} | ||
+ | |||
+ | {{:projetos:modeltrees:tesecesartaconeli.pdf|Tese de Doutorado de César Taconeli}} | ||
+ | |||
+ | {{:pessoais:dissertacao_rm.pdf|Dissertação de Mestrado de Rodrigo Moreira}} | ||
+ | |||
+ | ==== Recursos Computacionais ==== | ||
{{projetos:modeltrees:treestar1.zip|Star-Tree}} | {{projetos:modeltrees:treestar1.zip|Star-Tree}} | ||
+ | |||
+ | <code> | ||
+ | require(rpart) | ||
+ | z.auto <- rpart(Mileage ~ Weight, car.test.frame) | ||
+ | post(z.auto, file = "") # display tree on active device | ||
+ | # now construct postscript version on file "pretty.ps" | ||
+ | # with no title | ||
+ | post(z.auto, file = "pretty.ps", title = " ") | ||
+ | z.hp <- rpart(Mileage ~ Weight + HP, car.test.frame) | ||
+ | post(z.hp) | ||
+ | </code> | ||
+ | ==== Conjuntos de Dados ==== | ||
+ | |||
+ | === Classificação de solos segundo atributos químicos === | ||
+ | {{:projetos:modeltrees:guilhermecluster.rnw|Analise de Cluster + Arvores de Classificação - Guilherme Brenner}} | ||
+ | {{:projetos:modeltrees:quimicos_c1.txt|Atributos Químicos de Solos}} | ||
+ | {{:projetos:modeltrees:quimicos_c2.txt|Atributos Químicos de Solos}} | ||
+ | |||
+ | === Identificação de Fatores de Risco para Hipertensão=== | ||
+ | |||
+ | <code> | ||
+ | dados<-read.csv2('http://www.leg.ufpr.br/~joel/dados/hiipertensao.csv',na.strings="") | ||
+ | </code> | ||
+ | |||
+ | {{projetos:dados_hipertenso.txt|Banco de Dados - Hipertensão}} | ||
+ | |||
+ | {{pessoais:tinetoon:nomesvariaveis.xls|Nome das Variáveis - Hipertensão}} | ||
==== Links de Interesse ==== | ==== Links de Interesse ==== | ||
Linha 66: | Linha 100: | ||
} | } | ||
</bibtex> | </bibtex> | ||
- |