Não foi possível enviar o arquivo. Será algum problema com as permissões?
Essa é uma revisão anterior do documento!
Tabela de conteúdos
CE-003 Turma O - Primeiro semestre de 2011
No quadro abaixo será anotado o conteúdo dado em cada aula do curso.
São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas,
bem como os exercícios sugeridos.
Veja ainda depos da tabela as Atividades Complementares.
Referências
- B & M: BUSSAB, W.O. & MORETTIN, P.A. Estatística Básica. 5a Edição, Editora Saraiva
- M & L: MAGALHÃES, M.N.; LIMA, A.C.P. Noções de Probabilidade e Estatística. IME/SP. Editora EDUSP.
- B,R & B: BARBETTA, P.A, REIS, M.M. & BORNIA, A.C. (2004) Estatística para cursos de engenharia e informática. Editora da Atlas.
- WEB Online Statistics: An Interactive Multimedia Course of Study: Material online sobre estatística
Conteúdo das Aulas
B & M | M & L | B, R & B | Online | ||||||
---|---|---|---|---|---|---|---|---|---|
Data | Conteúdo | Leitura | Exercícios | Leitura | Exercícios | Leitura | Exercícios | Tópico | |
28/02 | Informações sobre o curso. Introdução e organização à disciplina. Chances e probabilidades. Alguns problemas e paradoxos (o problema do aniversário, o teste de diagnóstico, o problema das sequências). Demonstração computacional. | Cap 1 | | Cap 1 | | Cap 1 | | | |
02/03 | Probabilidades: definições de probabilidades (clássica, frequentista, subjetiva) conceitos: espaço de probabilidades, espaço amostral, eventos. Espaços discretos e contínuos. (wx)maxima e R | | | | | | |Arquivo de comandos do R |
| 18/04 |Funções da variáveis aleatórias. Variáveis bi(multidimensionais) |Cap 7, Sec 7.6, Cap 8 |Cap 7: 25 a 27, 39, Cap 8: 1, 2, 3, 6, 7, 18, 19, 20 |Cap 5 |Cap 5: Sec 5.1: 2 a 5 Sec 5.2: 2, 3, 5 e 6 | | | |
| 20/04 |Prova 1 | | | | | | |
| 25/04 |Noções de processos estocáticos: exemplos e definição, tempos e estados (discretos e contínuos), modelo probabilístico. Processos de tempo e estados discretos: Cadeia de Markov. Cadeias Finitas, probabilidades de transição, estacionaridade. Matrizes de transição e matrizes estocásticas, transição em M passos, vetor inicial, probabilidades marginais e estados absorventes. |ver sessão de complementos desta página | | ver abaixo | |||||||
27/04 | Estatística descritiva. Fontes de dados: estudos experimentais e observacionais. Tipos de variáveis: quantitativas (nominais e ordinais) e qualitativas (discretas e contínuas). Análises uni e bivariadas. Tabelas, gráficos e medidas adequadas para cada tipo de variáveis. Visualização de múltiplas variáveis. Tabelas: dados categóricos e agrupados. Frequencias easolutas e relativas. Gráficos: setores, barras, histograma, box-plot, de densidade (empírica). Medidas: moda, mediana média, quartis, variância e amplitude | Cap 2, 3 e 4 | ver materiais online e sessão de complementos desta página | Cap 1, 4 e 5 | ver materiais online | Material online com exemplos de análise de dados | |||
02/05 | PF-15 | Estatística descritiva univariada: tipos de variáveis: qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Gráficos. (histograma, pol. frequências, densidade empírica, ramo-e-folhas, box-plot | Cap 2, 3, Sec 3.4 (box-plot) | Cap 2: 4 a 7, 11, 12, 15; Cap 3: 11, 12, 13 | Cap 1 | Cap 1, Sec 1.2: 4, 5, Sec 1.4: 3, 4, 5, 6, 12,15, 20, 21, 22 | Ver complementos abaixo!!! | ||
04/05 | PF-15 | Estatística descritiva: medidas resumo. Medidas de posição, variabilidade e associação | Cap 3 e 4 | Cap 3: | Cap 4 e 5 | Ver complementos abaixo!!! |
Complementos
28/02/2011
- Assista o vídeo a seguir, reflita, discuta com os colegas e/ou em sala.
- Peter Donelly no TED Talks - como estatística e probabilidade podem ser usadas e … abusadas
- note que voce pode habilitar legendas em inglês, português ou outras línguas, se desejar
- procure anotar as principais mensagens da apresentação
- se voce tivesse que destacar a descrever 2 (dois) pontos principais da apresentação, quais seriam?
- Problemas para discussão:
- Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas:
- apenas sabendo que eles tem duas crianças
- depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc)
- você encontra os amigos e eles estão com uma das crianças com eles que é uma menina
- Quantas pessoas devem haver em um grupo para que a chance de haver ao menos uma coincidência de aniversários supere 50% ?
- Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A para R$ 1,00 para B. Se a soma for par, B para R$ 1,00 para A.
- quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores?
- quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores?
- o jogo é honesto?
14/03/2011
- Além dos exercícios indicados nos livros veja neste link execícios (com resolução) que voce pode tentar
- Assista novamente o vídeo de Peter Donnelly e concentre-se no exemplo do teste de diagnóstico. Estruture o problema e a solução utilizando notação adequada de probabilidades
16/03/2011
- Veja um vídeo com ainda uma outra explicação para o problema do tese de diagnóstico.
- Escreva uma rotina em alguma linguagem de programação para o problema do teste de diagnóstico. Considere as possíveis entradas e possíveis saidas. Use o programa para investigar o efeito da taxa básica (prevalência) nos resultados, bem como a acurácia dos testes, representando os resultados de alguma forma adequada (e.g. um gráfico). Use a página de Espaço Aberto para postar seu código.
28/03/2011
- Considere o problema da distribuição de probabilidades da soma do resultado do lançamento de dois dados. Encontre uma função de probabilidade adequada ao problema e utilize esta função para calcular e
- Considere um tipo dado especial onde cada face tem uma probabilidade de cair proporcional ao seu valor. Considere lançar dois destes dados. Monte o espaço amostra e obtenha a probabilidade de cada ponto. Defina uma v.a. como a soma dos valores das faces e monte a distribuição de probabilidades.
- Considere avaliar a probabilidade de ter uma "mão" de cinco cartas com exatamente 2 ases em duas situações: a) sabendo que possui um ás de copas, (b) sabendo que possui algum ás na mão. Voce acha que as probabilides am a) e b) sao iguais ou diferentes, e se diferentes qual é maior? Obtenha as probabilidades e verifique sua intuição
04/04/2011
- Obtenha as expressões de , , , , e para a distribuição uniforme contínua.
- Obtenha as expressões de , , , , e para a distribuição exponencial.
12/04/2011 e 14/04/2011
Usar os programas (wx)maxima e R para resolver os exercícios a seguir
- Fazer gráficos das diversas distribuições de probabilidades vistas nas aulas, variando os valores dos parâmetros e verificando como fica o comportamento da função.
- Estudar a distribuição de Weibull, fazer gráficos para diferentes valores dos parâmetros.
- Seja uma variável aleatória com distribuição Weibul
- Obtenha a expressão e o gráfico da função de densidade e de distribuição (acumulada) .
- Calcule as probabilidades:
- Calcule os quantis
- q tal que
- q tal que
- e tal que , com 0,25 de probabilidade abaixo de e acima .
- Seja uma variável aleatória com distribuição Gamma
- Obtenha o gráfico da função de densidade e de distribuição (acumulada) .
- Verifique como obter as probabilidades:
- Verifique como obter os quantis
- q tal que
- q tal que
- e tal que , com probabilidades abaixo de e acima de 0,25.
- Verifique como obter os quartis da distribuição
- Verificar as expressões das distribuições , e (ver sessão 7.7 em Bussab e Morettin) e como obter probabilidades q quantis utilizando as tabelas.
- Seja uma variável aleatória com distribuição (
Student com graus de liberdade). Obtenha usando a tabela da distribuição: - - - tal que - tal que - os quartis da distribuição - Seja uma variável aleatória com distribuição ( com graus de liberdade). Obtenha usando a tabela da distribuição: - - - - tal que - tal que - os quartis da distribuição
Usando o programa R para calcular probabilidades - Uma introdução
Para iniciar o R na linha de comando do Linux basta digitar: $ R * Prob no R - I * Prob no R - II * Prob no R - III <note>Alternativamente a utilizar diretamente na linha de comandos, é possível utilizar o R de dentro de alguns editores como ogedit
,vim
ou(x)emacs
, além de IDE's específicas como oRKward
eRstudio
. Para mais detalhes sobre interfaces gráficas para o R consulte a página de R GUI projects </note> ==== 25/04/2011 ==== === Parte 1 === - Considere a matriz de transição do exemplo 2 da aula. Escreva um programa para simular realizações desta cadeia (mostre resulçtados em um gráfico).
<latex> P = \left[\begin{array}{cc} 1/3 & 2/3
2/3 & 1/3 \end{array}\right] </latex> - Considere agora uma matriz de transição mais geral dada a seguir. Generalize seu programa do exemplo anterior e obtenha simulações para diferentes valores dep
. Escreva ainda uma rotina que receba os dados de uma cadeia e retorne uma estimativa dep
. Use esta rotina para obter valores estimados dep
para suas diferentes simulações (com o mesmop
e variandop
)
<latex> P = \left[\begin{array}{cc} p & 1-p
1-p & p \end{array}\right] </latex> - Idem anterior com
<latex> P=\left[\begin{array}{cc} p_1 & 1-p_1
1-p_2 & p_2 \end{array}\right] </latex> - Escreva agora uma rotina que calcule as probabilidades dos estados da cadeia em um passo (tempo) qualquer, a partir da matriz de transição e de um vetor de probabilidades iniciais. Experimente (por simulação) com diferentes valores deP
e - Idem anterior para um determinado inicial. - Resuma as conclusões que podem ser obtidas analisando os resultados das simulações anteriores === Parte 2 === - Estude o comportamento da cadeia definida pelo exemplo 1 visto em aula.
<latex> P=\left[\begin{array}{cccccc} 0,1 & 0,4 & 0,2 & 0,1 & 0,1 & 0,1
0,2 & 0,3 & 0,2 & 0,1 & 0,1 & 0,1
0,1 & 0,2 & 0,3 & 0,2 & 0,1 & 0,1
0,1 & 0,1 & 0,2 & 0,3 & 0,2 & 0,1
0,1 & 0,1 & 0,1 & 0,2 & 0,3 & 0,2
0,1 & 0,1 & 0,1 & 0,1 & 0,4 & 0,2
\end{array}\right] </latex> - Modificar a matriz P dada colocando na ultima linha:(0 0 0 0 0 1)
. Estude o comportamento da cadeia. - Estude o comportamento da cadeia com matriz de probabilidade de transição dada por
<latex> P=\left[\begin{array}{ccccc} 0,5 & 0,3 & 0,2 & 0,0 & 0,0
0,2 & 0,3 & 0,3 & 0,2 & 0,0
0,1 & 0,2 & 0,3 & 0,2 & 0,2
0,0 & 0,1 & 0,2 & 0,3 & 0,4
0,0 & 0,0 & 0,0 & 0,0 & 1,0
\end{array}\right] </latex> === Parte 3 === - Monte a matriz de transiçãoP
e estude as características da cadeia para o exemplo genético onde os pais tem genótiposAA
,Aa
ouaa
. Analise e inspecione (tb por simulação) o comportamento para diferentes valores iniciais. ==== 27/04/2011 ==== - Ver Sessões 9, 10 e 11 neste material online - Exemplos mostrados/usados e discutidos em aula (com comandos do R) - ExemploCO2
<code R> data(CO2) str(CO2) head(CO2) ?CO2 names(CO2) ## acessando os dados mean(CO2$uptake) with(CO2, mean(uptake)) ## resumos de uma variável attach(CO2) mean(uptake) summary(uptake) ## gráficos boxplot(uptake) ## relacionando uptake com outra variável (categórica) boxplot(uptake ~ Treatment) tapply(uptake, Treatment, mean) tapply(uptake, Treatment, summary) ## relacionando uptake com outras 2 variáveis (categóricas) tapply(uptake, list(Type, Treatment), mean) interaction.plot(Type , Treatment, uptake, type="b") interaction.plot(Type , Treatment, uptake, fun=median, type="b") ## mais visualizações, relacionando com outra variável numérica plot(uptake ~ conc) m1 ← tapply(uptake, conc, mean) points(as.numeric(names(m1)), m1, col=2, pch=19) by(CO2, Plant, function(x) with(x, lines(uptake ~ conc, col=gray))) coplot(uptake ~ conc|Plant) coplot(uptake ~ conc|Plant,show.given=FALSE) coplot(uptake ~ conc|Plant, panel=lines, type="b",show.given=FALSE) coplot(uptake ~ conc|Plant, panel=panel.smooth,show.given=FALSE) require(lattice) xyplot(uptake ~ conc|Plant) detach(CO2) </code> - Dadosmtcars
<code R> ## obtendo informações sobre os dados (metadados) data(mtcars) str(mtcars) head(mtcars) dim(mtcars) attach(mtcars) ## analises de uma variável quantitativa summary(mpg) boxplot(mpg) hist(mpg) rug(mpg) hist(mpg, prob=T) rug(mpg) lines(density(mpg)) h1 ← hist(mpg, prob=T) h1[1:2] table(cut(mpg, br=seq(10, 35, by=5))) ## um gráfico totalmente inadequado !!! pie(table(cut(mpg, br=seq(10, 35, by=5)))) ## análises de uma variável qualitativa (nominal) table(am) prop.table(table(am)) pie(table(am)) which.max(table(am)) ## analises de uma variável qualitativa (ordinal) table(cyl) prop.table(table(cyl)) barplot(table(cyl)) which.max(table(cyl)) ## "cruzando" variáveis qualitativas table(cyl, am) plot(table(cyl, am)) barplot(table(cyl, am)) barplot(table(cyl, am), beside=T) prop.table(table(cyl, am)) prop.table(table(cyl, am), mar=1) prop.table(table(cyl, am), mar=2) # ## tabela table(am) ## grafico pie(table(am), main="Câmbio", lab=c("automático" , "manual")) pie(table(am), main="Câmbio", lab=c("automático" , "manual")) , col=1:2, rad=1) ## medida (moda) am.t ← table(am) names(am.t) ← c("automático","manual") names(which.max(am.t)) ## em porcentagens prop.table(table(am)) ## agora para numero de marchas table(gear) barplot(prop.table(table(gear))) names(which.max(table(gear))) ## e agora relacionando as duas variáveis table(am, gear) plot(table(am, gear), main="Marchas vs Câmbio") barplot(table(am, gear), legend=T) barplot(table(gear, am), legend=T) prop.table(table(am, gear), mar=1) barplot(prop.table(table(am, gear), mar=1)) ## relacionando qualitativa e quantitativa tapply(mpg, am, mean) tapply(mpg, am, sd) tapply(mpg, am, summary) tapply(mpg, am, function(x) table(cut(x, br=seq(10, 30, by=5)))) boxplot(mpg ~ am) plot(am, mpg) boxplot(mpg ~ am) ## relacionando variáveis quantitativas plot(mpg ~ qsec) lines(lowess(mpg ~ qsec)) cor(mpg, qsec) plot(mpg ~ wt) lines(lowess(mpg ~ wt)) cor(mpg, wt) cor(mpg, wt, meth="sp") plot(qsec ~ wt) lines(lowess(qsec ~ wt)) cor(qsec, wt) cor(qsec, wt, meth="sp") plot(mtcars[,c(1,4,6,7)]) pairs(mtcars[,c(1,4,6,7)], panel=panel.smooth) cor(mtcars[,c(1,4,6,7)]) cor(mtcars[,c(1,4,6,7)], meth="sp") detach(mtcars) </code> ==== 02/05/2011 ==== * Hans Rosling no TED Talks - como os dados podem nos ajudar a compreender e destruir mitos sobre a realidade. Procure identificar ao menos cinco pontos importantes na apresentação para discussão ==== 04/05/2011 ==== Tópicos: * Análise Univariada * Medidas de posição: média, mediana, moda, média aparada, quantis * Medidas de dispersão: amplitude, variância, desvio padrão, desvio médio, amplitude interquartílica, coeficiente de variação * Cálculo das medidas para dados brutos e dados agrupados * Análise Bivariada * medidas de associação: variáveis qualitativas e quantitativas * , coeficiente de contingência, comparação de medidas resumo, covariâncas e coeficientes de correlação Referências adicionais e vídeos: * Vídeos sobre estatística da Khan Academy. Vídeos sugeridos * Statistics: The Average * Statistics: Sample vs. Population Mean * Statistics: Variance of a Population * Statistics: Sample Variance * Statistics: Standard Deviation * Statistics: Alternate Variance Formulas * Online Statistics * Gráficos * Resumos * Bivariado