CE-092 -- Segundo semestre de 2018
No quadro abaixo será anotado o conteúdo dado em cada aula do curso.
São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas,
bem como os exercícios sugeridos.
Veja ainda depois da tabela as Atividades Complementares.
Observação sobre exercícios recomendados os exercícios indicados são compatíveis com o nível e conteúdo do curso.
Se não puder fazer todos, escolha alguns entre os indicados.
Conteúdos das Aulas
Data | Conteúdo | Leitura | Tópico |
---|---|---|---|
31/07 Ter | Informações sobre o curso. Uma discussão sobre algumas possíveis extensões do modelo de regressão: GLM's, modelos com respostas transformadas. Modelos heterocedásticos e com covariância não nula entre observações. | Cap 1 - Introdução Livro do Faraway | Ver abaixo |
02/08 Qui | Discussão sobre o exercício do cálculo de média, incluindo uma revisão sobre estimação e métodos de estimação. Média como resultado de estimação por mínimos quadrados. Média como resultado de estimação por verossimilhança. Construção da verossimilhança para o problema proposto. Solução computacional. | Ver abaixo | |
07/08 Ter | Comentários adicionais sobre ajustes com dados intervalares. Modelos com transformação da variável resposta. Família (Box-Cox) de transformação. Outras distribuições para respostas. Regressão: média, por partes, regressão linear por partes e segmentada. | Ver abaixo | |
09/08 Qui | Regressão com variáveis transformadas e regressão por partes: detalhamento e códigos | Ver abaixo | |
14/08 Ter | Ajuste de diferentes médias. Parametrizações e reparametrizações. Matrizes dos modelos. Interpretação dos parâmetros. De regressão segmentada à regressão por partes. Restrição de continuidade. Expressão do modelo e número de parâmetros | Ver abaixo | |
16/08 Qui | Comandos para exemplos de regressão com transformação e segmentada. Funções polinomiais locais - o caso cúbicas. Restrições de continuidade e suavidade. O conceito de funções base. splines, Exemplos. | Ver abaixo | |
21/08 Ter | Ilustração de conceitos vistos com "scripts" computacionais. Fundamento para escolha do(s) nó(s) em regressão segmentada/splines | Ver abaixo | |
23/08 Qui | 1a avaliação intermediária | ||
28/08 Qui | Discussão da 1a avaliação intermediária. | Ver abaixo | |
30/08 Qui | Atividade de estudo. Sem aula expositiva | Ver abaixo | |
04/08 Ter | Outros métodos de suavização: KNN, kernel, suavização por splines, lowess | Cap 14: 14.1 a 14.4 | |
06/08 Qui | Outros métodos de suavização: KNN, kernel, suavização por splines, lowess (cont.) | Cap 14: 14.1 a 14.4 | |
11/08 Ter | Uma discussão sobre recursos computacionais e estatística. Introdução aos efeitos aleatórios | Ver abaixo | |
13/08 Qui | Efeitos aleatórios - um modelo particular e generalizações. Predição dos efeitos aleatórios | Ver abaixo | |
18/08 Ter | Efeitos aleatórios - Efeitos aleatórios por grupos de observações. Predição dos efeitos aleatórios. Especificação geral do modelo Gaussiano e casos vistos até aqui como particulares do modelo geral. | Ver abaixo | |
20/08 Qui | Estimação em efeitos aleatórios. Obtenção das expressões. Estimação por verossimilhança e métodos numéricos. | ||
27/08 Ter | Não houve aula. | ||
29/08 Qui | Computação em modelos de efeitos aleatórios | Ver abaixo | |
02/10 Ter | SIEPE - dia não letivo | ||
04/10 Qui | SIEPE - dia não letivo | ||
09/10 Qui | Discussão/interpretação do artigo de Singer et. al. | Ver abaixo | |
22/10 Ter | Simulação de dados em modelos de efeitos aleatórios. Modelos para respostas não gaussianas - introdução | Ver abaixo | |
24/10 Qui | Inferência em GLMM | Ver abaixo | |
30/10 Ter | Sem aula presencial. Atividade recomendada: discussão em grupo dos exercícios propostos nas últimas aulas | ||
01/11 Qui | Discussão de exemplo de análise da dados de contagem com efeitos aleatórios (Ex no livro de Faraway). glmmPQL() e glmer() | ||
06/11 Ter | Introdução às árvores. | Faraway, Cap 16: 16.1 e 16.2 | Ver abaixo |
08/11 Qui | Um pouco mais sobre árvores. Avaliação do ajuste. Características e limitações do método. Critérios para poda de árvores | Analisar via árvores dados vistos em alguma outra disciplina (reg/gamlss, …_ | |
13/11 Ter | Ajustando árvores de regressão e classificação. (Prof. Cesar) | Ver abaixo | |
15/11 Qui | Feriado. | ||
20/11 Ter | Árvores inferenciais - ctrees (prof. Cesar, continuação) | ||
22/11 Qui | Fundamentos de regressão heterocedástica (estrutural e correção de erros padrão) e regressão quantílica | Ver abaixo | |
27/11 Ter | Prova: modelos de efeitos aleatórios | ||
29/11 Qui | Introdução aos modelos não lineares. | slides\\Exemplo | |
03/12 Seg | Prova: árvores, modelos heterocedásticos, regressão quantílica, modelos não lineares |
31/07
- Calcular a média entre os três dados nas seguintes situações:
- As observações são: 22, 25, 32
- As observações são: <24, [23, 28] , >30
- As observações são: >24, [23, 28] , <30
- De todas as observações: pontuais e intervalares
- Generalizar o arquivo de comandos anterior para incluir a estimação da variância
- De forma semelhante ao problema anterior, deseja-se calcular a média os casos a seguir, sabendo-se agora que se referem a dados de contagem.
- As observações são: 2, 0, 5, 3, 1, 3, 1, 2
- As observações são: > 0, 0, [3-7], >= 1, 1, 3, < 3, ⇐ 4
02/08
- Seja uma variável (resposta) Y e uma covariável X com valores dados conforme abaixo. Ajuste um modelo de regressão linear simples.
X 0.4 1.2 1.8 1.9 2.0 6.8 7.6 8.3 8.7 9.3 10.7 11.3 13.0 13.4 14.2 Y 0.8 2.4 1.8 2.4 2.4 2.9 3.6 3.7 3.1 4.9 3.6 3.2 4.1 4.6 3.8 - Repita agora o ajusta porém supondo a seguinte tabela de dados (com algumas respostas intervalares)
X 0.4 1.2 1.8 1.9 2.0 6.8 7.6 8.3 8.7 9.3 10.7 11.3 13.0 13.4 14.2 Y 0.8 < 1.8 [1,5; 20] 2.4 > 2 2.9 3.6 < 4 [2,5; 4] > 4.5 < 4 3.2 4.1 [4; 5] < 5
07/08
- Utilizando este arquivo de dados, efetue as análises das regressões de Y1 vs x e Y2 vs x, cada uma delas com os modelos de regressão linear simples inicialmente e depois com:
- transformação (log) da variável resposta,
- transformação (raiz quadrada) da variável resposta,
- transformação (Box-Cox) da variável resposta
- distribuição Gama para a resposta.
- Compare as verossimilhanças dos modelos ajustados lembrando de torná-las comparáveis se necessário.
- Ainda utilizando os mesmos dados, ajuste modelos:
- de média constante,
- de médias constantes por partes/intervalos
- de regressão linear simples
- de regressão segmentada. Defina (arbitrariamente) um "ponto de corte" em 1,2
Copie o arquivo para um diretório (pasta), aponte o R para esta pasta e importe os dados com:
df <- read.table("df02.txt", head=TRUE)
09/08
- derivar e implementar modelos por partes para 3 ou mais partes
- derivar o modelo e escrever o código para o modelo de regressão segmentada (conectado no(s) nó(s))
- refazer os Exemplos 1 e 5 do arquivo de comandos porém agora estimando o "nó".
14/08
- (computacional) Ajuste o modelo de (3) médias sob as diferentes vistas na aula (.. e pode propor outras), discuta a interpretação dos parâmetros e verifique que as medidas de ajuste são iguais.
- Defina e ajuste um modelo de regressão segmentada para o exemplo (arquivo de dados da aula de 07/08) com um ponto de corte (nó) fixado.
- Idem fixando 2 nós.
- Discuta nos casos anteriores como devem ser interpretados os parâmetros de seu modelo.
- Procure explorar diferentes parametrizações.
- Proponha um ajuste de regressão segmentada para os dados:
MASS::mcycle with(MASS::mcycle, plot(accel ~ times))
16/08
- arquivo de comandos visto em aula - splines (nova versão, atualizado em 23/08 19:30)
- Refaça o exemplo com os dados
MASS::mcycle
mas agora ajustando splines cúbicos - Considere o problema de regressão por splines cúbicos com 1 ponto de corte e derive as expressões das restrições para continuidade e suavidade
- verifique as funções do pacote
splines
para construir splines. Refaça o exemplo de splines cúbicos do arquivo visto em aula utilizando tais funções.
21/08
- Arquivo de comandos visto em aula (atualizado de 09/08)
- Arquivo sobre média (e variância) na escala original) após transformação (nova versão, atualizado em 23/08)
28/08
Tópico para discussão: e estimação da média (esperança) a partir de um conjunto de dados depende da escolha da distribuição de probabilidades assumida para os dados?
Atividade computacional sugerida
- Gere um conjunto de dados pontuais e estime a média por verossimilhança assumindo diferentes distribuições. Verifique se as estimativas mudam.
- Idem anterior com dados (todos ou parte deles) intervalares
30/08
- Explorar detalhadamente este arquivo de comandos
11/09
- Explorar o material (shiny) preparado pela Jhenifer e Lineu
13/09
- Explorar o arquivo de comandos visto em aula.
- Procure mudar termos e opções para verificar os efeitos
- Escrever um código para estimar os parâmetros do modelo discutido em aula
18/09
- O arquivo de comandos visto na aula passada foi atualizado.
- Procure mudar termos e opções para verificar os efeitos
- Montar a matriz adequada para ajustar uma regressão linear para cada grupo, com os coeficientes da regressão considerados como aleatórios. Contraste com a regressão ajustada para cada grupo.
18/09
- O arquivo de comandos visto na aula passada foi novamente atualizado incluindo agora estimação de parâmetros.
29/09
- Um outro exemplo de códigos com uma análise similar. Modificar os códigos se necessário para nova versão da lme4. Interpretar os resultados e extrair resumos interessantes da análise.
- Estudar o artigo de Singer et.al. Confiabilidade e Precisão na Estimação de Médias
Julio M. Singer, Carmen Diva Saldiva de André, Clóvis de Araújo Peres
Confiabilidade e Precisão na Estimação de Médias
Revista Brasileira de Estatística, v73, n. 236, jan./jun. 2012. - Escrever códigos que reproduzam as análises do artigo
Local Concentra 1 170,6 1 154,7 1 136,4 1 153,1 2 68,0 2 66,4 2 70,3 2 71,1 3 151,5 3 138,0 3 128,4 3 118,1 4 153,9 4 149,1 4 147,5 4 103,8 5 83,9 5 101,4 5 117,3 5 114,1
09/10
- Códigos reproduzindo alguns resultados do artigo de Singer et. al.
22/10
Simular dados para cada uma das situações a seguir. Em cada caso fazer gráficos adequados dos dados simulados. Considerar diferentes cenários na simulação.
- Simular dados do modelo para grupos de observações, semelhante utilizado no artigo de Singer et al.
- Simular dados do modelo longitudinal com efeito linear no tempo e intercepto aleatório.
- Simular dados do modelo longitudinal com efeito linear no tempo e intercepto e inclinação aleatórios.
24/10
- Simular dados para cada uma das situações anteriores porém agora resposta Poisson. Em cada caso fazer gráficos adequados dos dados simulados. Considerar diferentes cenários na simulação.
- Ajustar modelos aos dados simulados usando a
lme4:::lmer()
- Escrever a expressão da verossimilhança para o modelo Poisson con efeito aleatório em grupos de observações (situação 1 das simulações)
- Desafio: escrever um código para estimar os parêmetros no primeiro caso e comparas suas estimativas com a da
lme4:::glmer()
07/11
- Arquivo de comandos visto em aula
22/11
- Artigo sobre modelos heterocedásticos
- Documentação do pacote (excelente texto explicativo)
- arquivo de comandos sobre regressão quantílica visto em aula