No quadro abaixo será anotado o conteúdo dado em cada aula do curso.
É indicado material para leitura correspondente ao conteúdo da aula nas referências bibliográficas básicas do curso:
B & M | M & L | B,R & B | Online | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Data | Local | Conteúdo | Leitura | Exercícios | Leitura | Exercícios | Leitura | Exercícios | Tópico | ||
09/08 | PC-19 | Informações sobre o curso. Introdução e organização à disciplina. Estatística: onde, quando, por que e para que?. Os três temas do curso: estatística descritiva, probabilidades e inferência – , ideias básicas e exemplos | Cap 1 | – | Cap 1 | — | Cap 1 | — | |||
11/08 | – | Não haverá aula presencial. Leitura e estudos: ver atividades abaixo | Cap 1 | – | Cap 1 | — | Cap 1 | — | Chapter 1, Sections A, B, C e D | ||
16/08 | PC-19 | Probabilidades: motivação, problemas e desafios. Experimentos aleatórios. Espaço amostral (equiprovável?, finito?, enumerável?). Eventos aleatórios. Definições de probabilidade: axiomática, clássica, freqüentista, subjetiva. | Cap 5 Sec 5.1 | Cap 5, 1 a 5 | Cap 2, Sec 2.1 | Cap 2, Sec 2.1: 1 a 5 | Cap 4, Sec 4.1 e 4.2 | Cap 4: 1 a 7 | Capter 5, Section A e B | ||
18/08 | PC-07 | Não haverá aula presencial. Leitura e estudos: ver atividades abaixo | — | — | — | — | — | ||||
23/08 | PC-19 | Probabilidades, definições, propriedades. Eventos mutuamente exclusivos. Probabilidade condicional e independência | Cap 5: Sec 5.1 a 5.3 | Cap 5: 7 a 22 | Cap 2: Sec 2.1 e 2.2 | Cap 2: Sec 2.2, 1 a 7 | Cap 4: Sec 4.1 a 4.3 | Cap 4: 8, 9, 12 a 17 | Capter 5, Section C, D, E | ||
25/08 | PC-07 | Probabilidades: teorema da probabilidade total, teorema de Bayes, Exercícios | Cap 5 | Cap 5: 23 a 25 | Cap 2 | Cap 2, Sec 2.3: 21 e 22 | Cap 4: Sec 4.4 e 4.5 | Cap 4: 10, 11, 18 a 21 | Capter 5, Section I, J, K | ||
30/08 | PC-19 | Probabilidades: discussões de problemas e exemplo. Variáveis aleatórias discretas e contínuas: introdução, motivação, definições, notação, propriedades. Função de probabilidade (discretas) e função de densidade de probabilidades (contínuas) | Cap 6, Sec 6.1 e 6.2; Cap 7, Sec 7.1 | Cap 6: 1 a 6; Cap 7: 1 a 4 | Cap 3, Sec 3.1; Cap 6, Sec 6.1 | Cap 3, Sec 3.1: 1 a 7; Cap 6, Sec 6.1: 1 a 5 | Cap 5, Sec 5.1; Cap 6, Sec 6.1 | Cap 5, Sec 5.1: 1 a 6; Cap 6, Sec 6.1: 1 a 5 | — | ||
01/09 | PC-07 | Variáveis aleatórias discretas e contínuas: esperança, variância. Distribuições acumuladas. Exemplos e exercícios | Cap 6, Sec 6.3 a 6.5; Cap 7, Sec 7.2 e 7.3 | Cap 6: 7 a 17; Cap 7: 5 a 10 | Cap 3, Sec 3.1; Cap 6, Sec 6.1 | Cap 3, Sec 3.4: 1 a 9; Cap 6, Sec 6.1: 1 a 6 | Cap 5, Sec 5.1; Cap 6, Sec 6.1 | — | — | ||
13/09 | PC-19 | Distribuições de variáveis aleatórias discretas: uniforma, Bernoulli, binomial, geométrica, binomial negativa (Pascal), hipergeométrica e Poisson | Cap 6, Sec 6.6 | Cap 6: 20 a 24, 26, 27, 29-34, 37, 39, 42, 56 | Cap 3, Sec 3.2 e 3.3 | Cap 3, Sec 3.2: 1 a 7; Sec 3.3: 1 a 6 | Cap 5, Sec 5.2 | Cap 5: 7 a 12 | — | ||
15/09 | PC-07 | Distribuições discretas: exercícios. Distribuições de variáveis aleatórias contínuas: uniforme, exponencial | Cap 7, Sec 7.4.1, 7.4.3 | Cap 7: 13, 21, 31, 40, 41 | Cap 6, Sec 6.2 (uniforme e exponencial) | Cap 6, Sec 6.2: 1 a 6, Sec 6.3: 16 a 24 | — | ||||
20/09 | PC-19 | Dúvidas, exercícios e revisão para prova I | |||||||||
22/09 | PC-07 | Prova I | |||||||||
27/09 | PC-19 | Distribuição Normal (Gaussiana) | Cap 7, Sec 7.4.2 | Ca7 7: 14 a 20 | Cap 6, Definição 6.6 | Cap 6, Sec 6.2: 7 a 9 | Cap 6, Sec 6.2.3 | Cap 6: 8 a 10 | Chapter IV | ||
29/09 | PC-07 | Distribuição Normal (Gaussiana). Exercícios. Aproximação normal à distribuição binomial | Cap 7, Sec 7.4.2 e 7.5 | Cap 7: 21 a 24, 33 a 38 | Cap 6, Definição 6.6 | Cap 6, Sec 6.3: 25 a 33 | Cap 6, Sec 6.2.3 e 6.3 | Cap 6: 11, 12, 17 a 24 | Chapter IV | ||
04/10 | PC-19 | Distribuição Normal (Gaussiana). Exercícios, aplicações. Aproximação normal à distribuição binomial | Cap 7, Sec 7.4.2 e 7.5 | ver anterior | Cap 6, Definição 6.6 | ver anterior | Cap 5: Sec 5.2 | ver anterior | Chapter IV | ||
06/10 | PC-07 | Distribuição de funções de v.a. contínuas. Outras distribuições: log-normal, Erlang, weibull, Gamma e Beta. Quantis. Uso do programa R para operações com distribuições de variáveis. Distribuição de funções de v.a. contínuas. | Cap 7, Sec 7.6, 7.7 e 7.8 | Cap 7: 25, 26, 39(a), 40, 41, 43, 44, 51 | Ver em B&M | ver em B&M | ver em B&M | ver em B&M | |||
11/10 | – | Feriado | |||||||||
13/10 | PC-07 | Estatística descritiva: motivação, uso, objetivos, organização de dados, análises univariadas: tipos de variáveis (qualitativas nominais e ordinais, quantitativas discretas e contínuas). Géficos, tabelas e medidas adequados a cada tipo de variável. | Cap 1, Cap 2, Sec 2.1, 2.2, 2.3 | Cap 2: 1, 2, 6, 7, 9 | Cap 1 | Cap 1, Sec 1.3: 1 a 3, Sec 1.4: 1 a 6 | Material com R na página do LEG | ||||
18/10 | PC-19 | Estatística descritiva (cont): distribuições de frequências, ramo e folhas, medidas descritivas, box-plot. (Ver abaixo comandos do R para produzir gráficos mostrados em sala) | Cap 2: 2.4. Cap 3 | Cap 2:4, 5, 11, 19, Cap 3: 1 a 6 | Cap 1, Cap 4 | Cap 1: 7 a 22 | Material online: Graphing distributions | ||||
20/10 | PC-07 | Estatística descritiva (cont): medidas de posição e dispersão | Cap 3 | Cap 3: 8 a 10, 16, 19 a 25, 29, 33, 35 | Cap 4 | Cap 4: 4.2: 1 a 6, 4.3: 1 a 6, 4.4: 1 a 9, 11 a 13 | Material online: summarizing distributions | ||||
25/10 | PC-19 | Dúvidas, exercícios e revisão para prova II | |||||||||
27/10 | PC-07 | Prova II | |||||||||
01/11 | — | Feriado | |||||||||
03/11 | PC-07 | Análise bivariada: variáveis qualitativas versus qualitativas, qualitativas versus quantitativas, quantitativas versus quantitativas. Gráficos, tabelas e Medidas. Medidas de associação: chi-quadrado, coeficientes de contingência. Coeficientes de correlação: linear de Pearson, Spearman e Kendall. Transformação de variáveis para linearização | Cap 4 | Cap 4: 1, 3, 4, 6, 7, 9, 10, 11, 13 | Cap 5 (Ver tb B&M) | Cap 5, Sec 5.2: 1, 3; Sec 5.3: 1, 2, 3, 5, 6 | Links para vídeos | ||||
08/11 | PC-19 | Inferência estatística: amostragem, população, amostra (amostra aleatória simples), parâmetros, estimadores e estimativas. Distribuição amostral dos estimadores. Estimadores pontuais e intervalares (intervalo de confiança). Distribuição amostral da uma proporção | Cap 10 | Cap 10: 1, 11, 12, 13, 17, 18 | Cap 7 | Cap 7, Sec 7.3: 6, Sec 7.4: 5 | Material online sobre estimação | ||||
17/11 | PC-07 | Inferência estatística: distribuição amostral: revisão e exemplos. Distribuição amostral da média. Teorema do limite central. Intervalos de confiança e tamanho da amostra. Estimação pontual e intervalar. Propriedades dos estimadores (nao tendenciosidade, eficiência e consistência) | Cap 10 | Cap 10: 7 a 10, 21 a 28 | Cap 7 | Cap 7, Sec 7.3: 5, 7 Sec 7.4: 1 a 4, Sec 7.5: 9 a 16 | Material online sobre distribuições amostrais | ||||
22/11 | PC-19 | Inferência estatística: Métodos de estimação: momentos, mínimos quadrados e máxima verossimilhaça. Regressão linear simples. Exemplos e exercícios | Cap 11 | Cap 11: 6 a 21, 23, 24, 26, 27, 29, 33 | Cap 7 (ver métodos de estimação em B&M) | Cap 7, Sec 7.5: 1, 2, 16 a 29, 33 e 34 | Material online sobre estimação. um vídeo rápido para reflexão | ||||
24/11 | PC-07 | Teste de hipóteses: fundamentos, hipóteses estatísticas, decisão, erro tipo I e tipo II. Nivel de significância e nível descritivo (p-valor). Exemplo. Teste para uma proporção. Regiões de rejeição e não rejeição (região crítica). Passos dos testes de hipóteses. | Cap 12 | Cap 12: 1 a 5, 10 a 13 | Cap 8 | Cap 8, Sec 8.1: 1 a 5 Sec 8.2: 6, Sec 8.6: 10 a 15 | Material online sobre Testes de Hipóteses |
Imagina-se que os experimentos (A) e (B) são repetidos muitas vezes e em cada uma anota-se o número de jogadas. Ao final calcula-se o número médio do número de jogadas anotadas em cada caso () e (). A questão levantada pelo apresentador é o que se espera:
Tente encontrar a resposta e/ou entender o argumento do apresentador. Adicionalmente, escreva um programa computacional que simule este experimento e encontre a solução através desta simulação. Coloque seu código na página Espaço Aberto do curso.
Soma 9: 1 2 6, 1 3 5, 1 4 4, 2 2 5, 2 3 4, 3 3 3, e
Soma 10: 1 3 6, 1 4 5, 2 2 6, 2 3 5, 2 4 4, 3 3 4, respectivamente.
Como pode este fato ser compatível com a experiência que leva jogadores de dados a considerarem que a
soma 9 ocorre menos vezes que a soma 10?
se há alguma estratégia mais vantajosa (trocar ou não a carta escolhida) e, se houver, apontar qual delas. Obter a solução de duas maneiras:
AmOc <- Vectorize(function(x) {i <- 1:x; 1 - sum((-1)^(i+1)/factorial(i))}) n <- 2:20 plot(n, AmOc(n)) abline(h=exp(-1))
## a linguagem R é interpretada 3+34 log(100) ## valores sao armazenados em "objetos" ## os simbolos "<-" ou "=" sao usados para atriburi valores os objetos x <- log(100) ## e digitando o nome do objeto o seu conteúdo é exibido x x = log(200) x x <- log(200) x ## vetores podem ser definidos e elementos são indexados a partir de 1 (e não 0!!!) x <- c(23, 21, 13,14) x x[1] ## a estrutura de um objeto pode ser exibida str(x) ## existem "funções"que efetuam cálculos estatísticos (dentre outros) ## por exemplo pnorm() é a função acumulada F(x) de distribuição normal 1 - pnorm(12, m=10, sd=2) ## podemos fazer um gráfico calculando e unindo pontos x <- seq(3, 17, len=100) x plot(x, dnorm(x, m=10, sd=2), ty="l") ## e vários aspectos do gráfico podem ser definidos plot(x, dnorm(x, m=10, sd=2), ty="l", xlab="x", ylab="f(x)") title("Distribuição normal N(10, 4)") ## a densidade f(x) é dad por dnorm() e as funções possuem documentação ?dnorm ## vejamos agora gráfico de uma log-normal ?dlnorm x <- seq(0, 20, l=100) fx <- dlnorm(x, 2, 1) plot(x, fx, ty="l") ## modificando para melhor visualização extendendo o eixo x <- seq(0, 35, l=100) fx <- dlnorm(x, 2, 1) plot(x, fx, ty="l") ## cálculos de probabilidade ## P[X < 25] plnorm(25, 2, 1) ## e de quantis ## P(X < a) = 0.6, a=? qlnorm(0.6, 2, 1) ## podemos ainda simular das distribuições sam <- rlnorm(500, 2, 1) sam plot(x, fx, ty="l") hist(sam, prob=T, add=T) ## Comparando com outra lognormal co diferentes parâmetros fx <- dlnorm(x, 2.5, 1.3) lines(x, fx, col=2) ## uma outra possibilidade é definir a função desejada derlang <- function(x, lambda, r){ ifelse(x < 0, 0, lambda^r * x^(r-1) * exp(-lambda*x)/factorial(r-1)) } ## verificando que a função integra 1 em seu domínio integrate(derlang, 0, Inf, lam=1/5, r=3) ## vendo o gráfico fx <- derlang(x, lam=1/10, r=1) plot(x, fx, ty="l") ## e note que a Erlang com r=1 coincide com a exponencial fx1 <- dexp(x, 1/10) lines(x, fx1, col=2) ## e agora com outros parâmetros fx <- derlang(x, lam=1/5, r=3) plot(x, fx, ty="l") ## Calculando prbabilidades por integração ## P[X < 10] integrate(derlang, 0, 10, lam=1/5, r=3) ## veja a documentação de função de integração numérica ?integrate ## P[5 < X < 15] integrate(derlang, 5, 15, lam=1/5, r=3) ## P[|X-10| > 3] integrate(derlang, 0, 7, lam=1/5, r=3)$val + integrate(derlang, 13, Inf, lam=1/5, r=3)$val ## os resultados da integração podem ser guardados em um objeto ## no caso o objeto é uma "lista" int <- integrate(derlang, 5, 15, lam=1/5, r=3) int str(int) ## $ é o extrator dos elementos da lista xd$val x$value int$value int$abs ## distribuição Gamma args(dgamma) ## gráficos com diferentes valores dos parâmetros x fx <- dgamma(x, sh=5, sc=2) plot(x, fx, ty="l") fx1 <- dgamma(x, sh=2, sc=5) lines(x, fx1, col=2) ## P[X > 15] pgamma(15, sh=5, sc=2, low=F) 1-pgamma(15, sh=5, sc=2) 1-pgamma(15, sh=2, sc=5)
dados <- c(3.67, 1.28, 3.96, 2.93, 7.77, 2.78, 1.82, 8.14, 6.54, 2.82, 4.65, 5.54, 3.73, 2.43, 5.84, 8.45, 1.88, 0.90, 4.10, 4.17, 7.35, 5.28, 2.12, 5.09, 4.30, 5.36, 3.63, 5.41, 4.26, 4.07) summary(dados) ## Histogramas mostrados na aula: ## histograma com frequencias absolutas e intervalos de classe de 1 unidade h1 <- hist(dados, breaks=seq(0, 9, by=1), main="") # histograma com frequencias absolutas e intervalos de classe de 1,5 unidades # e a ultima com duas unidades h2 <- hist(dados, breaks=c(0.5, 2, 3.5, 5.0, 6.5, 8.5), main="")
## vendo as classes e frequencias em cada caso h1[1:2] h2[1:2] ## e vendo de outra forma table(cut(dados, breaks=breaks=seq(0, 9, by=1))) table(cut(dados, breaks=c(0.5, 2, 3.5, 5.0, 6.5, 8.5))) ## agora outros gráficos: ## histograma de probabilidades, histograma suavizado ("density plot") e marcação de dados ("rug") hist(dados, main="", prob=TRUE) rug(dados) lines(density(dados)) ## note que o density() nao depende da definicao de classes! ## ou simplesmente plot(density(dados)) rug(dados) ## ramos e folhas stem(dados) ## boxplot: boxplot(dados)
Instalar o programa R mencionado na página do curso e experimentar com os comandos abaixo:
"aniv" <- function(n, p){ if(missing(n) && missing(p)) error("um dos argumentos, n ou p deve ser fornecido") if(!missing(n) && !missing(p)) error("apenas um dos argumentos, n ou p deve ser fornecido") Prob <- function(n) 1 - exp(sum(log(365:(365-n+1))) - n*log(365)) VecProb <- Vectorize(Prob, "n") if(missing(n)) res <- sapply(p, function(y) which((VecProb(1:366) - y) > 0)[1]) if(missing(p)) res <- VecProb(n) return(res) } aniv(n=23) aniv(n=c(10, 20, 35, 50, 57)) aniv(n=366) plot(1:366, aniv(n=1:366), type="l", xlab="n", ylab="P[Coincidencia]") aniv(p=0.5) aniv(p=c(0.2, 0.4, 0.5, 0.7, 0.9, 0.99)) plot(1:100, aniv(n=1:100), type="l", xlab="n", ylab="P[Coincidencia]") arrows(c(1,aniv(p=0.5)),c(0.5, 0.5),c(aniv(p=0.5),aniv(p=0.5)),c(0.5,0), length=0.1) text(1, 0.5, 0.5, pos=2, off=0.1, cex=0.7) text(aniv(p=0.5),0 ,aniv(p=0.5), pos=1, off=0.2, cex=0.7)
"nTenta" <- function(N, padrao="HTT", media = TRUE){ padrao <- strsplit(padrao, NULL)[[1]] nc <- length(padrao) nTenta <- numeric(N) for(i in 1:N){ res <- sample(c("H","T"), nc, rep=T) n <- nc while(any(res != padrao)){ res <- c(res[2:nc], sample(c("H","T"), 1, rep=T)) n <- n+1 } nTenta[i] <- n } if(media) return(mean(nTenta)) else return(nTenta) } nTenta(10000, "HTT") nTenta(10000, "HTH")
"jogo" <- function(){ cartas <- LETTERS[1:3] premio <- sample(cartas, 1) escolha <- sample(cartas, 1) sobra <- cartas[which(cartas != escolha)] mostra <- sample(sobra[which(sobra != premio)], 1) NTroca <- escolha Res.NT <- ifelse(NTroca == premio, "Ganhou", "Perdeu") Troca <- sobra[sobra != mostra] Res.T <- ifelse(Troca == premio, "Ganhou", "Perdeu") return(c(premio, escolha, mostra, NTroca, Res.NT, Troca, Res.T)) } set.seed(231) sim <- as.data.frame(t(replicate(10000, jogo()))) names(sim) <- c("premio", "escolha", "mostra", "NTroca", "Res.NT", "Troca", "Res.T") #sim prop.table(table(sim$Res.NT)) prop.table(table(sim$Res.T))
Assistir, comentar e discutir os vídeos a seguir sobre algumas ferramentas e propostas para visualizar e aprender com dados.
Educação estatística e sua importância: uma opinião em apenas 3 minutos!