Essa é uma revisão anterior do documento!
Modelagem e análise de dados experimentais com o programa computacional R
Descrição
Disciplina: Tópicos Especiais - Modelagem e análise de dados experimentais com o programa computacional R
Professor Coordenador: PhD. Paulo Justiniano Ribeiro Júnior, LEG/UFPR
Professor Colaborador: MSc. Walmes Marques Zeviani, LEG/UFPR
Nº de Créditos: 2
Carga horária: 30h
Período Letivo: 7 à 11 de Fevereiro de 2011
Ementa da disciplina
Análise exploratória de dados; Testes de significâncias; Análise de regressão; Delineamentos experimentais; Interpretação dos resultados experimentais.
Justificativa
Esta disciplina será importante para aprofundar a teoria de planejamento e análise de experimentos além de instrumentalizar os participantes com as funcionalidades do aplicativo estatístico R.
Objetivo Geral da disciplina
Abordar, com enfoque computacional, técnicas de análise de dados experimentais usando o aplicativo R. Pré-requisito: curso básico de experimentação agrícola.
Conteúdo
- Introdução à manipulação de objetos e funções no R: definição de objeto, tipos de objeto, criação, acesso e modificação de objetos, criação e aplicação de funções;
- Importação de dados e análise exploratória: entrada de dados pelo teclado, por arquivo externo, análise gráfica exploratória;
- Estatística básica: estatísticas descritivas de posição, dispersão, assimetria, curtose, gráficos de distribuição de frequência, teste de normalidade, teste de aderência, geração de números aleatórios, teste de hipótese e intervalos de confiança para médias, proporções, variâncias e correlações.
- Regressão linear: preparação dos dados, definição do modelo e pressuposições, estimação dos parâmetros, interpretação dos parâmetros, análise de resíduos e checagem das pressuposições do modelo, medidas de influência, inferência para os parâmetros (teste de hipótese, intervalos de confiança, regiões de confiança), predição de valores, elaboração de gráficos, procedimento stepwise, critério de AIC e BIC, remoção de outliers, transformação de dados;
- Regressão não linear: definição, exemplos, preparação dos dados, definição do modelo, estimação dos parâmetros, análise de resíduos, inferência para os parâmetros (teste de hipótese, intervalos de confiança, teste da razão de verossimilhança), comparação de curvas ajustadas, ajuste de modelos com restrição na estimação dos parâmetros, predição de valores, elaboração de gráficos;
- Análise de experimentos balanceados: experimento em delineamento inteiramente ao acaso com fator qualitativo (um fator e fatorial duplo), experimento em blocos ao acaso com fator qualitativo (um fator e fatorial duplo), experimento fatorial duplo com tratamentos adicionais (testemunhas), análise de covariância, modelos de regressão polinomial na análise de variância (fatorial qualitativo x quantitativo), fatorial com fatores quantitativos (modelos de superfície de resposta), experimento em parcela subdividida e subsubdividida, análise de resíduos, checagem das pressuposições do modelo, transformação de dados, testes de médias e contrastes;
- Introdução a análise de experimentos com respostas não normais: definição de modelo linear generalizado, estimação de parâmetros, métodos de inferência, análise respostas do tipo proporção, análise de respostas do tipo contagem;
- Elaboração de gráficos: diagramas de dispersão, histogramas, gráficos de barras, boxplots, gráfico de funções, controle dos parâmetros gráficos e customização.
Metodologia
As aulas teóricas serão expositivas e a prática será realizada com estudos de caso.
Avaliação
Avaliação de um relatório de análise de dados. O documento deve descrever a forma de aquisição dos dados (observacionais ou experimentais), delineamento envolvido, fatores em estudo, níveis dos fatores, respostas avaliadas, gráficos exploratórios e medidas descritivas dos dados, o modelo estatístico assumido para os dados bem como o conjunto de pressuposições envolvidas, os resultados das análises e a discussão das conclusões. O código R e os comentários devem estar presentes do documento. Enviar um arquivo *zip
com nome do aluno (meu_nome.zip
) contendo um aquivo em formato *pdf
que é o relatório das análises, um script reproduzível em formato *R
com os comandos da análise e o arquivo com os dados usados em formato *txt
. Consulte um exemplo do relatório e do script. Os relatórios devem ser enviados até as 23:59 do dia 21/02/2011 (segunda-feira) por e-mail (walmes@ufpr.br
) com o título "Relatório de análise do Curso de R".
Local das aulas
Laboratório de informática do Setor de Ciências Agrárias da UFPR situado no bloco central do link (http://maps.google.com.br/maps?q=-25.41062,-49.249279&num=1&t=h&sll=-14.239424,-53.186502&sspn=39.0226,41.6098&ie=UTF8&ll=-25.410773,-49.249233&spn=0.001097,0.002411&z=19).
Referências bibliográficas
- [2009, techreport | www]
- Ribeiro Júnior, P. J. (2009). Introdução ao Ambiente Estatístico R.
- [2002, techreport | www]
- Faraway, J. J. (2002). Practical Regression and Anova using {R}.
- [2005, book | www]
- Faraway, J. J. (2005). Linear models with R Chapman \& Hall/{CRC}.
- [2002, book | www]
- Venables, W. N., & Ripley, B. D. (2002). Modern applied statistics with S Birkhäuser.
- [2009, book | www]
- Everitt, B. S., & Hothorn, T. (2009). A Handbook of Statistical Analyses Using R, Second Edition (2 ed.) Chapman \& Hall.
- [2008, book | www]
- Dalgaard, P. (2008). Introductory Statistics with R (2nd ed.) Springer.
- [2008, book | www]
- Dobson, A. J., & Barnett, A. (2008). An Introduction to Generalized Linear Models, Third Edition (3 ed.) Chapman and {Hall/CRC}.
- [2008, book | www]
- Ritz, C., & Streibig, J. C. (2008). Nonlinear Regression with R (1 ed.) Springer.
- [2008, book | www]
- Sarkar, D. (2008). Lattice: Multivariate Data Visualization with R (1 ed.) Springer.
- [2005, book | www]
- Murrell, P. (2005). R Graphics (1 ed.) Chapman and {Hall/CRC}.
Material usado no curso
- Guia com rotinas em *pdf (download);
- Guia com rotinas em *R (download);
- Dados em planilha eletrônica (*.xls) (download);
- Dados em arquivos de texto (*.txt) compactados (*.zip) (download);
Cronograma de atividades do Curso
Data | Manhã | Tarde |
---|---|---|
SEG 07 | Abordado o conteúdo do item 1 ao 2.1 do *pdf | Visitar as urls fornecidas, importar um arquivo de dados e praticar |
TER 08 | Abordado o conteúdo do item 2.1 ao item 3 | Obter gŕaficos exploratórios e medidas descritivas dos dados importados |
QUA 09 | Abordado o todo o conteúdo do item 4 | Rever as análises, aplicá-las em outros dados |
QUI 10 | Abordado o conteúdo do item 6 e 7 | Rever as análises, aplicá-las em outros dados |
SEX 11 | Abordado os itens 8, 9, 12 e 14 | Ver os itens não abordados, explorar o pacote ExpDes e aplicar à outros dados |
SEG 21 | Último dia para envio dos relatórios das análises (prazo até às 23:59 h) |
Páginas para serem visitadas
- Blog de R que reúne posts diários de mais de 150 blogs dedicados a R (http://www.r-bloggers.com/)
- Lista de discussão nacional sobre R (http://br.groups.yahoo.com/group/R_STAT/)
- Material sobre R desenvolvido pelo Professor Paulo Justiniano Ribeiro Júnior (UFPR) (http://www.leg.ufpr.br/doku.php/sofware:material-r)
- Material sobre R desenvolvido pelo Professor Daniel Furtado Ferreira (UFLA) (http://www.dex.ufla.br/~danielff/)
- Site de busca em lista de discussão internacional de R (http://r-project.markmail.org/search/?q=)
- Site para download do Emacs para Windows (http://vgoulet.act.ulaval.ca/en/ressources/emacs/)
- Página do Professor Eric Batista Ferreira desenvolvedor do pacote não oficial ExpDes (https://sites.google.com/site/ericbferreira/unifal/downloads-1)
- Apostila de Estatística Experimental da Pesquisadora Janaína Ribeiro Costa (Embrapa) (http://www.cnpab.embrapa.br/publicacoes/download/doc163.pdf)
- Cartilha de referência do R por Tom Short, traz um resumo das funções mais usadas (http://cran.r-project.org/doc/contrib/Short-refcard.pdf)
- Lista das abreviações dos pacotes e funções do R por Jeromy Anglim (http://jeromyanglim.blogspot.com/2010/05/abbreviations-of-r-commands-explained.html)
Foto
Alguns dos participantes do Curso no último dia. Essa galera é empenhada e foi muito interessante interagir com eles, aprendi muito. Espero vocês em novos cursos. Abraço.
Relatórios enviados
Participante | Status |
---|---|
Edycélia Coelho | zip completo e salvo para avaliação |
Diego Surek | completo e salvo para avaliação |
Paula Leal | zip completo e salvo para avaliação |
Dani Machado | zip completo e salvo para avaliação |
Carolina Zanatta | zip completo e salvo para avaliação |
Antônio Feraz | rar completo e salvo para avaliação |
Andressa Ribeiro | rar completo e salvo para avaliação |
Susana Gilaverte | completo e salvo para avaliação |
Espaço do participante
Dê sua opinião e me ajude a melhorar o curso. Critique, comente, sugira, tire dúvidas, discuta, expresse-se. Sua opinião é importante.