Não foi possível enviar o arquivo. Será algum problema com as permissões?

Essa é uma revisão anterior do documento!


CE-003 Turma O - Segundo semestre de 2010

CE-003 Turma O - Segundo semestre de 2010

Conteúdo e estudos do curso

No quadro abaixo será anotado o conteúdo dado em cada aula do curso.
É indicado material para leitura correspondente ao conteúdo da aula nas referências bibliográficas básicas do curso:

B & M M & L B,R & B Online
Data Local Conteúdo Leitura Exercícios Leitura Exercícios Leitura Exercícios Tópico
09/08 PC-19 Informações sobre o curso. Introdução e organização à disciplina. Estatística: onde, quando, por que e para que?. Os três temas do curso: estatística descritiva, probabilidades e inferência – , ideias básicas e exemplos Cap 1 Cap 1 Cap 1
11/08 Não haverá aula presencial. Leitura e estudos: ver atividades abaixo Cap 1 Cap 1 Cap 1 Chapter 1, Sections A, B, C e D
16/08 PC-19 Probabilidades: motivação, problemas e desafios. Experimentos aleatórios. Espaço amostral (equiprovável?, finito?, enumerável?). Eventos aleatórios. Definições de probabilidade: axiomática, clássica, freqüentista, subjetiva. Cap 5 Sec 5.1 Cap 5, 1 a 5 Cap 2, Sec 2.1 Cap 2, Sec 2.1: 1 a 5 Cap 4, Sec 4.1 e 4.2 Cap 4: 1 a 7 Capter 5, Section A e B
18/08 PC-07 Não haverá aula presencial. Leitura e estudos: ver atividades abaixo
23/08 PC-19 Probabilidades, definições, propriedades. Eventos mutuamente exclusivos. Probabilidade condicional e independência Cap 5: Sec 5.1 a 5.3 Cap 5: 7 a 22 Cap 2: Sec 2.1 e 2.2 Cap 2: Sec 2.2, 1 a 7 Cap 4: Sec 4.1 a 4.3 Cap 4: 8, 9, 12 a 17Capter 5, Section C, D, E
25/08 PC-07 Probabilidades: teorema da probabilidade total, teorema de Bayes, Exercícios Cap 5 Cap 5: 23 a 25 Cap 2 Cap 2, Sec 2.3: 21 e 22 Cap 4: Sec 4.4 e 4.5 Cap 4: 10, 11, 18 a 21 Capter 5, Section I, J, K
30/08 PC-19 Probabilidades: discussões de problemas e exemplo. Variáveis aleatórias discretas e contínuas: introdução, motivação, definições, notação, propriedades. Função de probabilidade (discretas) e função de densidade de probabilidades (contínuas) Cap 6, Sec 6.1 e 6.2; Cap 7, Sec 7.1 Cap 6: 1 a 6; Cap 7: 1 a 4 Cap 3, Sec 3.1; Cap 6, Sec 6.1 Cap 3, Sec 3.1: 1 a 7; Cap 6, Sec 6.1: 1 a 5 Cap 5, Sec 5.1; Cap 6, Sec 6.1 Cap 5, Sec 5.1: 1 a 6; Cap 6, Sec 6.1: 1 a 5
01/09 PC-07 Variáveis aleatórias discretas e contínuas: esperança, variância. Distribuições acumuladas. Exemplos e exercícios Cap 6, Sec 6.3 a 6.5; Cap 7, Sec 7.2 e 7.3 Cap 6: 7 a 17; Cap 7: 5 a 10 Cap 3, Sec 3.1; Cap 6, Sec 6.1 Cap 3, Sec 3.4: 1 a 9; Cap 6, Sec 6.1: 1 a 6 Cap 5, Sec 5.1; Cap 6, Sec 6.1
13/09 PC-19 Distribuições de variáveis aleatórias discretas: uniforma, Bernoulli, binomial, geométrica, binomial negativa (Pascal), hipergeométrica e Poisson Cap 6, Sec 6.6 Cap 6: 20 a 24, 26, 27, 29-34, 37, 39, 42, 56 Cap 3, Sec 3.2 e 3.3Cap 3, Sec 3.2: 1 a 7; Sec 3.3: 1 a 6 Cap 5, Sec 5.2 Cap 5: 7 a 12
15/09 PC-07 Distribuições discretas: exercícios. Distribuições de variáveis aleatórias contínuas: uniforme, exponencial Cap 7, Sec 7.4.1, 7.4.3 Cap 7: 13, 21, 31, 40, 41 Cap 6, Sec 6.2 (uniforme e exponencial) Cap 6, Sec 6.2: 1 a 6, Sec 6.3: 16 a 24
20/09 PC-19 Dúvidas, exercícios e revisão para prova I
22/09 PC-07 Prova I
27/09 PC-19 Distribuição Normal (Gaussiana) Cap 7, Sec 7.4.2 Ca7 7: 14 a 20 Cap 6, Definição 6.6 Cap 6, Sec 6.2: 7 a 9 Cap 6, Sec 6.2.3 Cap 6: 8 a 10 Chapter IV
29/09 PC-07 Distribuição Normal (Gaussiana). Exercícios. Aproximação normal à distribuição binomial Cap 7, Sec 7.4.2 e 7.5 Cap 7: 21 a 24, 33 a 38 Cap 6, Definição 6.6 Cap 6, Sec 6.3: 25 a 33 Cap 6, Sec 6.2.3 e 6.3 Cap 6: 11, 12, 17 a 24 Chapter IV
04/10 PC-19 Distribuição Normal (Gaussiana). Exercícios, aplicações. Aproximação normal à distribuição binomial Cap 7, Sec 7.4.2 e 7.5 ver anterior Cap 6, Definição 6.6 ver anterior Cap 5: Sec 5.2 ver anterior Chapter IV
06/10 PC-07 Distribuição de funções de v.a. contínuas. Outras distribuições: log-normal, Erlang, weibull, Gamma e Beta. Quantis. Uso do programa R para operações com distribuições de variáveis. Distribuição de funções de v.a. contínuas. Cap 7, Sec 7.6, 7.7 e 7.8 Cap 7: 25, 26, 39(a), 40, 41, 43, 44, 51 Ver em B&M ver em B&M ver em B&M ver em B&M
11/10 Feriado
13/10 PC-07 Estatística descritiva: motivação, uso, objetivos, organização de dados, análises univariadas: tipos de variáveis (qualitativas nominais e ordinais, quantitativas discretas e contínuas). Géficos, tabelas e medidas adequados a cada tipo de variável. Cap 1, Cap 2, Sec 2.1, 2.2, 2.3 Cap 2: 1, 2, 6, 7, 9 Cap 1 Cap 1, Sec 1.3: 1 a 3, Sec 1.4: 1 a 6 Material com R na página do LEG
18/10 PC-19 Estatística descritiva (cont): distribuições de frequências, ramo e folhas, medidas descritivas, box-plot. (Ver abaixo comandos do R para produzir gráficos mostrados em sala) Cap 2: 2.4. Cap 3 Cap 2:4, 5, 11, 19, Cap 3: 1 a 6 Cap 1, Cap 4 Cap 1: 7 a 22 Material online: Graphing distributions
20/10 PC-07 Estatística descritiva (cont): medidas de posição e dispersão Cap 3 Cap 3: 8 a 10, 16, 19 a 25, 29, 33, 35 Cap 4 Cap 4: 4.2: 1 a 6, 4.3: 1 a 6, 4.4: 1 a 9, 11 a 13 Material online: summarizing distributions
25/10 PC-19 Dúvidas, exercícios e revisão para prova II
27/10 PC-07 Prova II
01/11 Feriado
03/11 PC-07 Análise bivariada: variáveis qualitativas versus qualitativas, qualitativas versus quantitativas, quantitativas versus quantitativas. Gráficos, tabelas e Medidas. Medidas de associação: chi-quadrado, coeficientes de contingência. Coeficientes de correlação: linear de Pearson, Spearman e Kendall. Transformação de variáveis para linearização Cap 4 Cap 4: 1, 3, 4, 6, 7, 9, 10, 11, 13Cap 5 (Ver tb B&M) Cap 5, Sec 5.2: 1, 3; Sec 5.3: 1, 2, 3, 5, 6 Links para vídeos
08/11 PC-19 Inferência estatística: amostragem, população, amostra (amostra aleatória simples), parâmetros, estimadores e estimativas. Distribuição amostral dos estimadores. Estimadores pontuais e intervalares (intervalo de confiança). Distribuição amostral da uma proporção Cap 10 Cap 10: 1, 11, 12, 13, 17, 18 Cap 7 Cap 7, Sec 7.3: 6, Sec 7.4: 5 Material online sobre estimação
17/11 PC-07 Inferência estatística: distribuição amostral: revisão e exemplos. Distribuição amostral da média. Teorema do limite central. Intervalos de confiança e tamanho da amostra. Estimação pontual e intervalar. Propriedades dos estimadores (nao tendenciosidade, eficiência e consistência) Cap 10 Cap 10: 7 a 10, 21 a 28 Cap 7 Cap 7, Sec 7.3: 5, 7 Sec 7.4: 1 a 4, Sec 7.5: 9 a 16 Material online sobre distribuições amostrais
22/11 PC-19 Inferência estatística: Métodos de estimação: momentos, mínimos quadrados e maxima verossimilhaça. Regressão linear simples. Exemplos e exercícios Cap 11 Cap 11: 6 a 21, 23, 24, 26, 27, 29, 33 Cap 7 (ver métodos de estimação em B&M) Cap 7, Sec 7.5: 1, 2, 16 a 29, 33 e 34 Material online sobre estimação. um vídeo rápido para reflexão
24/11 PC-07 Teste de hipóteses: fundamentos, hipóteses estatísticas, decisão, erro tipo I e tipo II. Nivel de significância e nível descritivo (p-valor). Exemplo. Teste para uma proporção. Regioes de rejeição e não rejeição (região crítica). Passos dos testes de hipóteses. Cap 12 Cap 12: 1 a 5 10 a 13 Cap 8 Cap 8, Sec 8.1: 1 a 5 Sec 8.2: 6, Sec 8.6: 10 a 15 http://onlinestatbook.com/chapter9/logic_hypothesis.html

Atividades Adicionais do Curso

11/08

  1. Problemas para discussão:
    1. Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas:
      • apenas sabendo que eles tem duas crianças
      • depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc)
      • você encontra os amigos e eles estão com uma das crianças com eles que é uma menina
    2. Quantas pessoas devem haver em um grupo para que a chance de haver ao menos uma coincidência de aniversários supera 50% ?
    3. Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A para R$ 1,00 para B. Se a soma for par, B para R$ 1,00 para A.
      • quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores?
      • quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores?
      • o jogo é honesto?
  2. Assista os vídeos a seguir, reflita, discuta com os colegas e em sala. (note que você pode habilitar legendas em inglês ou português se desejar):
    • Hans Rosling no TED Talks - como os dados podem nos ajudar a compreender e destruir mitos sobre a realidade
    • Peter Donnelly no TED Talks - como estatística e probabilidade podem ser usadas e … abusadas
    • note que você pode habilitar legendas em inglês, português ou outras línguas, se desejar
    • procure anotar as principais mensagens de cada apresentação
    • se você tivesse que destacar a descrever 2 (dois) pontos principais ou surpreendentes em cada apresentação, quais seriam?


16/08/2010

  • Leituras adicionais
  • Exercício adicional
    • No vídeo de Peter Donnelly indicado acima, ele pede à audiência para imaginar o seguinte experimento aleatório jogando-se várias vezes uma moeda:
      • (A) conta-se o número de jogadas até se obter a sequência cara-coroa-coroa (head-tail-tail - HTT),
      • (B) conta-se o número de jogadas até se obter a sequência cara-coroa-head (head-tail-head - HTH).

Imagina-se que os experimentos (A) e (B) são repetidos muitas vezes e em cada uma anota-se o número de jogadas. Ao final calcula-se o número médio do número de jogadas anotadas em cada caso (n_{A}) e (n_{B}). A questão levantada pelo apresentador é o que se espera:

  • n_{A} = n_{B} ou n_{A} > n_{B} ou n_{A} < n_{B} ?

Tente encontrar a resposta e/ou entender o argumento do apresentador. Adicionalmente, escreva um programa computacional que simule este experimento e encontre a solução através desta simulação. Coloque seu código na página Espaço Aberto do curso.


16/08/2010

  • Ver(rever) atividades acima
  • Lista de exercícios (em breve aqui)


23/08/2010

  • Refazer o problema dos jogadores (A e B) no jogo de dados com as seguintes regras:
    1. se a soma for 7, A ganha e B para R$ 1,00 para A
    2. se a soma for 6, B ganha e A para R$ 1,00 para B
    3. para qualquer outro resultado não há ganhador
  • Discuta com exemplos a diferença dos conceitos de eventos mutuamente exclusivos e eventos independentes
  • Fazer um programa na linguagem computacional de sua preferência para avaliar por simulação o número médio de tentativas para obter HTT e HTH no problema apresentado por Peter Donnelly mencionado acima. Coloque seu código na página Espaço Aberto do curso.


25/08/2010

  • Voltar à discussão do teste de HIV apresentada no vídeo de Peter Donnelly. Representar o problema em notação correta seguindo o exemplo dado em sala de aula.
  • No lançamento de três dados equilibrados, 9 e 10 pontos podem ser obtidos de seis maneiras diferentes:

Soma 9: 1 2 6, 1 3 5, 1 4 4, 2 2 5, 2 3 4, 3 3 3, e
Soma 10: 1 3 6, 1 4 5, 2 2 6, 2 3 5, 2 4 4, 3 3 4, respectivamente.
Como pode este fato ser compatível com a experiência que leva jogadores de dados a considerarem que a soma 9 ocorre menos vezes que a soma 10?

  • Refletir sobre o problema da carta premiada apresentado em sala, lembrando que o objetivo é verificar

se há alguma estratégia mais vantajosa (trocar ou não a carta escolhida) e, se houver, apontar qual delas. Obter a solução de duas maneiras:

  1. Fazendo um programa de simulação (postar código na página de espaço aberto)
  2. Buscando uma explicação para a resposta


30/08/2010

  • O problema do amigo oculto. Um grupo de pessoas resolveu fazer um amigo oculto. Para isto o nome de cada um foi escrito em um papel, os papeis foram misturados e cada um enviado a uma pessoa de forma completamente aleatória.
    1. Suponha inicialmente que temos 5 pessoas. Qual a probabilidade que todos recebam o seu próprio nome?
    2. O que deve acontecer com a probabilidade do ítem anterior a medida que aumenta o número de pessoas? (voce pode ilustrar isto com um gráfico)
    3. Supondo 5 pessoas, qual a probabilidade de que ninguém receba o seu próprio nome.
    4. O que deve acontecer com a probabilidade do ítem anterior a medida que aumenta o número de pessoas? (voce pode ilustrar isto com um gráfico)

 AmOc <- Vectorize(function(x) {i <- 1:x; 1 - sum((-1)^(i+1)/factorial(i))}) 
 n <- 2:20 
 plot(n, AmOc(n)) 
 abline(h=exp(-1)) 


06/09/2010

## a linguagem R é interpretada
3+34
log(100)
## valores sao armazenados em "objetos"
## os simbolos "<-" ou "=" sao usados para atriburi valores os objetos
x <- log(100)
## e digitando o nome do objeto o seu conteúdo é exibido
x
x = log(200)
x
x <-  log(200)
x
## vetores podem ser definidos e elementos são indexados a partir de 1 (e não 0!!!)
x <- c(23, 21, 13,14)
x
x[1]
## a estrutura de um objeto pode ser exibida 
str(x)
 
## existem "funções"que efetuam cálculos estatísticos (dentre outros)
## por exemplo pnorm() é a função acumulada F(x) de distribuição normal
1 - pnorm(12, m=10, sd=2)
## podemos fazer um gráfico calculando e unindo pontos
x <- seq(3, 17, len=100)
x
plot(x, dnorm(x, m=10, sd=2), ty="l")
## e vários aspectos do gráfico podem ser definidos
plot(x, dnorm(x, m=10, sd=2), ty="l", xlab="x", ylab="f(x)")
title("Distribuição normal N(10, 4)")
 
## a densidade f(x) é dad por dnorm() e as funções possuem documentação
?dnorm
 
## vejamos agora gráfico de uma log-normal
?dlnorm
x <- seq(0, 20, l=100)
fx <- dlnorm(x, 2, 1)
plot(x, fx, ty="l")
## modificando para melhor visualização extendendo o eixo
x <- seq(0, 35, l=100)
fx <- dlnorm(x, 2, 1)
plot(x, fx, ty="l")
## cálculos de probabilidade
## P[X < 25] 
plnorm(25, 2, 1)
## e de quantis
## P(X < a) = 0.6, a=?
qlnorm(0.6, 2, 1)
## podemos ainda simular das distribuições
sam <- rlnorm(500, 2, 1)
sam
plot(x, fx, ty="l")
hist(sam, prob=T, add=T)
## Comparando com outra lognormal co  diferentes parâmetros
fx <- dlnorm(x, 2.5, 1.3)
lines(x, fx, col=2)
 
## uma outra possibilidade é definir a função desejada
derlang <- function(x, lambda, r){
  ifelse(x < 0, 0, lambda^r * x^(r-1) * exp(-lambda*x)/factorial(r-1))
}
 
## verificando que a função integra 1 em seu domínio
integrate(derlang, 0, Inf, lam=1/5, r=3)
## vendo o gráfico
fx <- derlang(x, lam=1/10, r=1)
plot(x, fx, ty="l")
## e note que a Erlang com r=1 coincide com a exponencial
fx1 <- dexp(x, 1/10)
lines(x, fx1, col=2)
## e agora com outros parâmetros
fx <- derlang(x, lam=1/5, r=3)
plot(x, fx, ty="l")
## Calculando prbabilidades por integração
## P[X < 10]
integrate(derlang, 0, 10, lam=1/5, r=3)
## veja a documentação de função de integração numérica
?integrate
## P[5 < X < 15]
integrate(derlang, 5, 15, lam=1/5, r=3)
## P[|X-10| > 3]
integrate(derlang, 0, 7, lam=1/5, r=3)$val + integrate(derlang, 13, Inf, lam=1/5, r=3)$val
 
## os resultados da integração podem ser guardados em um objeto
## no caso o objeto é uma "lista"
int <- integrate(derlang, 5, 15, lam=1/5, r=3)
int
str(int)
## $ é o extrator dos elementos da lista
xd$val
x$value
int$value
int$abs
 
## distribuição Gamma
args(dgamma)
## gráficos com diferentes valores dos parâmetros
x
fx <- dgamma(x, sh=5, sc=2)
plot(x, fx, ty="l")
fx1 <- dgamma(x, sh=2, sc=5)
lines(x, fx1, col=2)
## P[X > 15]
pgamma(15, sh=5, sc=2, low=F)
1-pgamma(15, sh=5, sc=2)
1-pgamma(15, sh=2, sc=5)

18/10/2010

dados <- c(3.67, 1.28, 3.96, 2.93, 7.77, 2.78, 
           1.82, 8.14, 6.54, 2.82, 4.65, 5.54, 
           3.73, 2.43, 5.84, 8.45, 1.88, 0.90,
           4.10, 4.17, 7.35, 5.28, 2.12, 5.09, 
           4.30, 5.36, 3.63, 5.41, 4.26, 4.07)
summary(dados)
 
## Histogramas mostrados na aula:
## histograma com frequencias absolutas e intervalos de classe de 1 unidade
h1 <- hist(dados, breaks=seq(0, 9, by=1), main="")
# histograma com frequencias absolutas e intervalos de classe de 1,5 unidades
# e a ultima com duas unidades
h2 <- hist(dados, breaks=c(0.5, 2, 3.5, 5.0, 6.5, 8.5), main="")

## vendo as classes e frequencias em cada caso
h1[1:2]
h2[1:2]
 
## e vendo de outra forma
table(cut(dados, breaks=breaks=seq(0, 9, by=1)))
table(cut(dados, breaks=c(0.5, 2, 3.5, 5.0, 6.5, 8.5)))
 
## agora outros gráficos: 
## histograma de probabilidades, histograma suavizado ("density plot") e marcação de dados ("rug") 
hist(dados, main="", prob=TRUE)
rug(dados)
lines(density(dados))
## note que o density() nao depende da definicao de classes!
 
## ou simplesmente
plot(density(dados))
rug(dados)
 
## ramos e folhas
stem(dados)
 
## boxplot:
boxplot(dados)



Códigos R

Instalar o programa R mencionado na página do curso e experimentar com os comandos abaixo:

  1. O problema dos aniversários
    "aniv" <- function(n, p){
      if(missing(n) && missing(p))
        error("um dos argumentos, n ou p deve ser fornecido")
      if(!missing(n) && !missing(p))
        error("apenas um dos argumentos, n ou p deve ser fornecido")
      Prob <- function(n) 1 - exp(sum(log(365:(365-n+1))) - n*log(365))
      VecProb <- Vectorize(Prob, "n")
      if(missing(n))
        res <- sapply(p, function(y) which((VecProb(1:366) - y) > 0)[1])
      if(missing(p))
        res <- VecProb(n)
      return(res)
    }
     
    aniv(n=23)
    aniv(n=c(10, 20, 35, 50, 57))
    aniv(n=366)
    plot(1:366, aniv(n=1:366), type="l", xlab="n", ylab="P[Coincidencia]")
     
    aniv(p=0.5)
    aniv(p=c(0.2, 0.4, 0.5, 0.7, 0.9, 0.99))
     
    plot(1:100, aniv(n=1:100), type="l", xlab="n", ylab="P[Coincidencia]")
    arrows(c(1,aniv(p=0.5)),c(0.5, 0.5),c(aniv(p=0.5),aniv(p=0.5)),c(0.5,0), length=0.1)
    text(1, 0.5, 0.5, pos=2, off=0.1, cex=0.7)
    text(aniv(p=0.5),0 ,aniv(p=0.5), pos=1, off=0.2, cex=0.7)
  2. O problema das sequências de caras e coroas
    "nTenta" <- function(N, padrao="HTT", media = TRUE){
      padrao <- strsplit(padrao, NULL)[[1]]
      nc <- length(padrao)
      nTenta <- numeric(N)
      for(i in 1:N){
        res <- sample(c("H","T"), nc, rep=T)
        n <- nc
        while(any(res != padrao)){
          res <- c(res[2:nc],  sample(c("H","T"), 1, rep=T))
          n <- n+1
        }
        nTenta[i] <- n
      }
      if(media) return(mean(nTenta))
      else return(nTenta)
    }
     
    nTenta(10000, "HTT")
    nTenta(10000, "HTH")
  3. O problema da carta premiada (Monty Hall)
    "jogo" <- function(){
      cartas <- LETTERS[1:3]
      premio <- sample(cartas, 1)
      escolha <- sample(cartas, 1)
      sobra <- cartas[which(cartas != escolha)]
      mostra <- sample(sobra[which(sobra != premio)], 1)
      NTroca <- escolha
      Res.NT <- ifelse(NTroca == premio, "Ganhou", "Perdeu")
      Troca <- sobra[sobra != mostra]
      Res.T <- ifelse(Troca == premio, "Ganhou", "Perdeu")
      return(c(premio, escolha, mostra, NTroca, Res.NT, Troca, Res.T))
    }
     
    set.seed(231)
    sim <- as.data.frame(t(replicate(10000, jogo())))
    names(sim) <- c("premio", "escolha", "mostra", "NTroca", "Res.NT", "Troca", "Res.T")
    #sim
     
    prop.table(table(sim$Res.NT))
    prop.table(table(sim$Res.T))



03/11/2010

Assistir, comentar e discutir os vídeos a seguir sobre algumas ferramentas e propostas para visualizar e aprender com dados.

07/11/2010

Educação estatística e sua importância: uma opinião em apenas 3 minutos!


QR Code
QR Code disciplinas:ce003o-2010-02:historico (generated for current page)