====== CE-003 Turma O - Primeiro semestre de 2011 ======
No quadro abaixo será anotado o conteúdo dado em cada aula do curso. \\
São indicados os Capítulos e Sessões correspondentes nas referências bibliográficas,
bem como os exercícios sugeridos.
Veja as **Atividades Complementares**abaixo da tabela.
\\
**Referências**\\
* **B & M**: BUSSAB, W.O. & MORETTIN, P.A. Estatística Básica. 5a Edição, Editora Saraiva
* **M & L**: MAGALHÃES, M.N.; LIMA, A.C.P. [[http://www.ime.usp.br/~noproest|Noções de Probabilidade e Estatística]]. IME/SP. Editora EDUSP.
* **B,R & B**: BARBETTA, P.A, REIS, M.M. & BORNIA, A.C. (2004) Estatística para cursos de engenharia e informática. Editora da Atlas.
* **WEB** [[http://onlinestatbook.com/|Online Statistics: An Interactive Multimedia Course of Study]]: Material online sobre estatística
\\
===== Conteúdo das Aulas =====
^^ ^^ B & M ^^ M & L ^^ B, R & B ^^ Online ^
^ Data ^ Conteúdo ^ Leitura ^ Exercícios ^Leitura ^ Exercícios ^Leitura ^ Exercícios ^ Tópico ^
| 28/02 |Informações sobre o curso. Introdução e organização à disciplina. Chances e probabilidades. Alguns problemas e paradoxos (o problema do aniversário, o teste de diagnóstico, o problema das sequências). Demonstração computacional. |Cap 1 | -- |Cap 1 | --- |Cap 1 | --- | --- |
| 02/03 |Probabilidades: definições de probabilidades (clássica, frequentista, subjetiva) conceitos: espaço de probabilidades, espaço amostral, eventos. Espaços discretos e contínuos. sigmaálgebra. Definição axiomática de probabilidades. Propriedades. Probabilidade de união, intercecção e condicional. Exemplos. |Cap 5, Sec 5.1 e 5.2 |Cap 5: 1 a 14 |Cap 2, Sec 2.1 |Cap 2: Sec 2.1: 1 a 5, Sec 2.3: 1 a 7 |Cap 4, Sec 4.1 e 4.2 |Cap 4: 1 a 7 |[[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens A, B, C, D, E)]] |
| 14/03 |Probabilidades (cont): probabilidades marginais, conjuntas e condicionais. Probabilidade total e Teorema de Bayes. Probabilidade condicional e independência |Cap 5 |Cap 5: 15 a 25 |Cap 2 |Cap 2: Sec 2.2: 4 a 7, Sec 2.3: 8 a 15|Cap 4 |Cap 4: 8 a 21 | [[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens H, I, J, K)]] |
| 16/03 |Probabilidades: Exemplos adicionais. Variáveis Aleatórias - introdução, definição. Distribuição de Probabilidades. Função de (massa de) probabilidade. Distribuição Binomial. Distribuição Hipergeométrica |Cap 6, Sec 6.1, 6.2, 6.6.3, 6.6.4 |Cap 6: 1 a 6, 20, 22 |Cap 3, Sec 3.1 e 3.2 |Cap 3: Sec 3.1: 1 a 6, Sec 3.2: 1 a 7 | | | [[http://onlinestatbook.com/chapter5/probability.html|Online Statistics (Itens E, F e M)]] |
| 21/03 |Variáveis aleatórias discretas: definições, valor médio, variância, propriedades, quantis |Cap 6, Sec 6.1 a 6.5 e 6.8 |Cap 6: 7 a 19, 29 e 30 |Cap 3 |Cap 3, Sec 3.1 e 3.2 (ver tb B&M): 1 a 6, Sec 3.4: 1 a 10 | | | [[http://onlinestatbook.com/chapter5/probability.html|Curso online (Itens E, F e M)]] |
| 23/03 |Variáveis aleatórias discretas: distribuições uniforme, binomial, geométrica hipergeométrica, Poisson, binomial negativa (Pascal), multinomial |Cap 6 |Cap 6: 20 a 28 |Cap 3 |Cap 3, Sec 3.3: 1 a 6, Sec 3.4: 11 a 27 | | | |
| 28/03 |Probabilidades e Variáveis aleatórias discretas: revisão. Introdução a v.a. contínuas: definição, função de densidade de probabilidade |Cap 5, 6 e 7 (Sec 7.1) |Cap 7: 1 a 4 |Cap 6, Sec 6.1 |Cap 6, Sec 6.1: 1 a 3 | | |
| 30/03 |Variáveis aleatórias contínuas: Introdução a v.a. contínuas: definição, função de distribuição de probabilidades, exemplos, função acumulada (de distribuição), esperança, variância. |Cap 7, Sec 7.1 a 7.3 |Cap 7: 1 a 12 |Cap 6: Sec 6.1 |Cap 6, Sec 6.1: 1 a 5 | | |
| 04/04 |Variáveis aleatórias contínuas: algumas funções de densidade de probabilidade: uniforme, exponencial |Cap 7, Sec 7.4 |Cap 7: 13 e 21, 28, 29, 3140, 41 |Cap 6: Sec 6.2 |Cap 6, Sec 6.2: 1 a 6, SEc 6.3: 16 a 24 | | |
| 06/04 |Distribuição normal, aplicações e aproximação à binomial e Poisson |Cap 7, 7.4 e 7.5 |Cap 7: 14 a 24 |Cap 6, Sec 6.2 |Sec 6.2: 7 a 9, Sec 6.3: 25 a 33 | | | [[http://onlinestatbook.com/2/normal_distribution/normal_distribution.html|Material online]] |
| 11/04 |Exercícios de revisão. Aproximação normal da binomial. Outras distribuições: Erlang e Gamma. Outras distribuições Weibull, chi^2, t de Student e F de Snedecor |Cap 7 |Cap 7, Sec |Cap 6 |Cap 6 (ver tb B&M) | | | Prob no R: [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8600012|Parte I]], [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase13.html#x15-8800013|Parte II]], [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase14.html#x16-9600014|Parte III]] |
| 13/04 |Usando o computador para cálculos de probabilidade: programas **''(wx)maxima''** e **''R''** | | | | | | |{{:disciplinas:ce003e:aula2011-04-13.r|Arquivo de comandos do R}} |
| 18/04 |Funções da variáveis aleatórias. Variáveis bi(multidimensionais) |Cap 7, Sec 7.6, Cap 8 |Cap 7: 25 a 27, 39, Cap 8: 1, 2, 3, 6, 7, 18, 19, 20 |Cap 5 |Cap 5: Sec 5.1: 2 a 5 Sec 5.2: 2, 3, 5 e 6 | | | |
| 20/04 |Prova 1 | | | | | | |
| 25/04 |Noções de processos estocáticos: exemplos e definição, tempos e estados (discretos e contínuos), modelo probabilístico. Processos de tempo e estados discretos: Cadeia de Markov. Cadeias Finitas, probabilidades de transição, estacionaridade. Matrizes de transição e matrizes estocásticas, transição em M passos, vetor inicial, probabilidades marginais e estados absorventes. |ver sessão de complementos desta página |-- |-- |-- |-- |-- |**ver abaixo** |
| 27/04 |Estatística descritiva. Fontes de dados: estudos experimentais e observacionais. Tipos de variáveis: quantitativas (nominais e ordinais) e qualitativas (discretas e contínuas). Análises uni e bivariadas. Tabelas, gráficos e medidas adequadas para cada tipo de variáveis. Visualização de múltiplas variáveis. Tabelas: dados categóricos e agrupados. Frequencias easolutas e relativas. Gráficos: setores, barras, histograma, box-plot, de densidade (empírica). Medidas: moda, mediana média, quartis, variância e amplitude |Cap 2, 3 e 4 |ver materiais online e sessão de complementos desta página |Cap 1, 4 e 5 |ver materiais online | | |[[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase9.html#x11-570009|Material online com exemplos de análise de dados]] |
| 02/05 |Estatística descritiva univariada: tipos de variáveis: qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Gráficos. (histograma, pol. frequências, densidade empírica, ramo-e-folhas, box-plot |Cap 2, 3, Sec 3.4 (box-plot) |Cap 2: 4 a 7, 11, 12, 15; Cap 3: 11, 12, 13 |Cap 1 |Cap 1, Sec 1.2: 4, 5, Sec 1.4: 3, 4, 5, 6, 12,15, 20, 21, 22 | | |Ver complementos abaixo!!! |
| 04/05 |Estatística descritiva: medidas resumo. Medidas de posição, variabilidade e associação |Cap 3 e 4 |Cap 3: |Cap 4 e 5 | | | |**Ver complementos abaixo!!!** |
| 11/05 |Inferência estatística: população e amostra, amostragem e amostra aleatória simples, estatística e parâmetros, estimadores e estimativas. Distribuições amostrais. Distribuição amostral da média e proporção |Cap 10 |Cap 10: 1, 3, 7 a 10, 11 a 13 |Cap 7 |Cap 7, Sec 7.1: 1, 2; Sec 7.3: 1 a 7, Cap 7.4: 1 a 5 | | | |
| 16-18/05 | PF-15 |Inferência estatística (revisão e continuação). Dsicussão da 1a prova |Cap 10 |Cap 10: 4, 14, 17 a 20, 21 a 28 |Cap 7 |Cap 7, Sec 7.5: 1, 3, 6, 9, 14, 17, 20 | | | |
| 23/05 |Inferência estatística: propriedades dos estimadores (não tendenciosidade, consistência, eficiência), intervalo de confiança e tamanho da amostra |Cap 10 |Cap 10: |Cap 7 |Cap 7, Sec 7.5: 1 a 5, 21 a 29 | | | |
| 25/05 |2a prova | --- | --- | --- | --- | | | |
| 30/05 |Discussão da 2a prova. Métodos de Estimação: método de mínimos quadrados, dos momentos e da máxima verossimilhança | Cap 11, 11.3, 11.4 e 11.5 |Cap 11: 6 a 13 |Ver B&M |Ver B&M | | | |
| 01/06 |Inferẽncia: revisão e exercícios: intervalos de confiança, tamanho de amostra, estimadores e estimativas de máxima verossimilhança | | | | --- | | | |
| 06/06 |Inferência: intervalos de confiança para variância, Outros intervalos: diferenças de médias, proporções e quociente de 2 variâncias. Introdução a teste de hipóteses: conceitos introdutórios, passos de um teste de hipóteses, ex com teste de hipótese de uma média |Cap 12 |Cap 12: 3, 5, 6 a 13, 22 a 24 |Cap 8 |Cap 8: Sec 8.1: 1 a 5, Sec 8.2: 1 a 3 | | |[[http://onlinestatbook.com/2/logic_of_hypothesis_testing/logic_hypothesis.html|Material online]] |
| 08/06 |Teste de hipóteses: revisão, exemplos e diferentes tipos de testes. Erros tipo I e II. Região crítica, valor-P |Cap 12 |Cap 12: 1, 2, 4, 14, 15, 16 a 20 |Cap 8 |Cap 8: Sec 8.1: 1 a 5, Sec 8.2: 1 a 3 | | |[[http://onlinestatbook.com/2/logic_of_hypothesis_testing/logic_hypothesis.html|Material online]] |
| 13/06 |Teste de hipóteses: revisão, exemplos/exercícios e diferentes tipos de testes. |Cap 12 e 13 |Cap 12: 21 a 24, 25 a 40; Cap 13: 1 a 3, 5 a 9, 16, 19 |Cap 8 |Cap 8: Sec 8.3: 1 a 6, Sec 8.4: 1 a 4 | | | |
| 15/06 |Teste de hipóteses: revisão, exemplos/exercícios. Testes chi^2 aderência e independência |Cap 14 |Cap 14: 3, 5 a 9, 13, 14 |Cap 8, Sec 8.5 |Cap 8: Sec 8.8: 1 a 7 | | | |
\\
\\
\\
===== Complementos =====
==== 28/02/2011 ====
- Assista o vídeo a seguir, reflita, discuta com os colegas e/ou em sala.
* [[http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html|Peter Donelly]] no TED Talks - como estatística e probabilidade podem ser usadas e ... abusadas
* **note que voce pode habilitar legendas em inglês, português ou outras línguas, se desejar **
* ** procure anotar as principais mensagens da apresentação **
* **se voce tivesse que destacar a descrever 2 (dois) pontos principais da apresentação, quais seriam?**
- **Problemas para discussão:**
- Desejamos saber a probabilidade de um casal ter duas filhas (meninas) em três situações distintas:
* apenas sabendo que eles tem duas crianças
* depois que o pai comenta que tem uma filha (sem dar mais detalhes, sem indicar se é a mais velha ou mais nova etc)
* você encontra os amigos e eles estão com uma das crianças com eles que é uma menina
- Quantas pessoas devem haver em um grupo para que a chance de haver ao menos uma coincidência de aniversários supere 50% ?
- Dois jogadores (A e B) vão jogar um jogo que consiste no lançamento de dois dados. Ambos começam com R$ 10,00. Se a soma dos dados for um número ímpar, A para R$ 1,00 para B. Se a soma for par, B para R$ 1,00 para A.
* quais os possíveis valores em dinheiro que os jogadores podem ter após 2 rodadas? A chance é a mesma para todos esses possíveis valores?
* quais os possíveis valores em dinheiro que os jogadores podem ter após 3 rodadas? A chance é a mesma para todos esses possíveis valores?
* o jogo é honesto?
==== 14/03/2011 ====
* Além dos exercícios indicados nos livros veja [[http://www.matematicadidatica.com.br/ProbabilidadeExercicios.aspx|neste link execícios (com resolução)]] que voce pode tentar
* Assista novamente o vídeo de Peter Donnelly e concentre-se no exemplo do teste de diagnóstico. Estruture o problema e a solução utilizando notação adequada de probabilidades
==== 16/03/2011 ====
* [[http://onlinestatbook.com/2/probability/base_ratesM.html|Veja um vídeo]] com ainda uma outra explicação para o problema do tese de diagnóstico.
* Escreva uma rotina em alguma linguagem de programação para o problema do teste de diagnóstico. Considere as possíveis entradas e possíveis saidas. Use o programa para investigar o efeito da taxa básica (prevalência) nos resultados, bem como a acurácia dos testes, representando os resultados de alguma forma adequada (e.g. um gráfico). Use a página de [[disciplinas:ce003o-2011-01:aberto|Espaço Aberto]] para postar seu código.
* [[http://onlinestatbook.com/2/probability/ch5_exercisesM.html|Exercícios propostos em material online]]
==== 28/03/2011 ====
* Considere o problema da distribuição de probabilidades da soma do resultado do lançamento de dois dados. Encontre uma função de probabilidade adequada ao problema e utilize esta função para calcular E(X) e V(X)
* Considere um tipo dado especial onde cada face tem uma probabilidade de cair proporcional ao seu valor. Considere lançar dois destes dados. Monte o espaço amostra e obtenha a probabilidade de cada ponto. Defina uma v.a. como a soma dos valores das faces e monte a distribuição de probabilidades.
* Considere avaliar a probabilidade de ter uma "mão" de cinco cartas com exatamente 2 ases em duas situações: a) sabendo que possui um ás de copas, (b) sabendo que possui algum ás na mão. Voce acha que as probabilides am a) e b) sao iguais ou diferentes, e se diferentes qual é maior? Obtenha as probabilidades e verifique sua intuição
==== 04/04/2011 ====
* Obtenha as expressões de E(X), V(X), F(X), md(X), q_{0,05} e q_{0,95} para a distribuição uniforme contínua.
* Obtenha as expressões de E(X), V(X), F(X), md(X), q_{0,05} e q_{0,95} para a distribuição exponencial.
==== 12/04/2011 e 14/04/2011 ====
**Usar os programas (wx)maxima e R para resolver os exercícios a seguir**
- Fazer gráficos das diversas distribuições de probabilidades vistas nas aulas, variando os valores dos parâmetros e verificando como fica o comportamento da função.
- Estudar a distribuição de Weibull, fazer gráficos para diferentes valores dos parâmetros.
- Seja uma variável aleatória com distribuição Weibul W(\alpha=2, \beta=20)
- Obtenha a expressão e o gráfico da função de densidade f(x) e de distribuição (acumulada) F(x).
- Calcule as probabilidades:
* P[X > 40]
* P[X < 50]
* P[10 < X < 45]
* P[X < 5 ou X > 40]
- Calcule os quantis
* q tal que P[X > q] = 0.90
* q tal que P[X < q] = 0.10
* q_1 e q_2 tal que P[q_1 < X < q_2] = 0.50, com 0,25 de probabilidade abaixo de q_1 e acima q_2.
- Seja uma variável aleatória com distribuição Gamma G(\alpha=3, \beta=10)
- Obtenha o gráfico da função de densidade f(x) e de distribuição (acumulada) F(x).
- Verifique como obter as probabilidades:
* P[X > 50]
* P[X < 10]
* P[20 < X < 80]
* P[X < 5 ou X > 90]
- Verifique como obter os quantis
* q tal que P[X > q] = 0.90
* q tal que P[X < q] = 0.10
* q_1 e q_2 tal que P[q_1 < X < q_2] = 0.50, com probabilidades abaixo de q_1 e acima q_2 de 0,25.
- Verifique como obter os quartis da distribuição
- Verificar as expressões das distribuições t, chi^2 e F (ver sessão 7.7 em Bussab e Morettin) e como obter probabilidades q quantis utilizando as tabelas. \\
- Seja X uma variável aleatória com distribuição t_(8) (tStudent com \nu=8 graus de liberdade). Obtenha usando a tabela da distribuição:
- P[X > 1.5]
- P[-2 < X < 2]
- k tal que P[|X| < k ] = 0.80
- k tal que P[X < k ] = 0.10
- os quartis da distribuição
- Seja X uma variável aleatória com distribuição \chi_(12) (qui-quadrado com \nu=12 graus de liberdade). Obtenha usando a tabela da distribuição:
- P[X > 20]
- P[X < 5]
- P[10 < X < 25]
- k tal que P[|X| < k ] = 0.80
- k tal que P[X < k ] = 0.10
- os quartis da distribuição
\\
\\
**Usando o programa R para calcular probabilidades - Uma introdução**\\
Para iniciar o R na linha de comando do Linux basta digitar:
$ R
* [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8600012|Prob no R - I]]
* [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase13.html#x15-8800013|Prob no R - II]]
* [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase14.html#x16-9600014|Prob no R - III]]
Alternativamente a utilizar diretamente na linha de comandos, é possível utilizar o R de dentro de alguns editores como o ''[[http://sourceforge.net/projects/rgedit/|gedit]]'', ''[[http://www.vim.org/scripts/script.php?script_id=2628|vim]]'' ou ''[[http://stat.ethz.ch/ESS/|(x)emacs]]'', além de IDE's específicas como o ''[[http://rkward.sourceforge.net|RKward]]'' e ''[[http://www.rstudio.org|Rstudio]]''.
Para mais detalhes sobre interfaces gráficas para o R consulte a página de [[http://www.r-project.org/GUI/|R GUI projects]]
==== 25/04/2011 ====
=== Parte 1 ===
- Considere a matriz de transição do exemplo 2 da aula. Escreva um programa para simular realizações desta cadeia (mostre resultados em um gráfico).\\
P = \left[\begin{array}{cc} 1/3 & 2/3 \\ 2/3 & 1/3 \end{array}\right]
- Considere agora uma matriz de transição mais geral dada a seguir. Generalize seu programa do exemplo anterior e obtenha simulações para diferentes valores de ''p''. Escreva ainda uma rotina que receba os dados de uma cadeia e retorne uma estimativa de ''p''. Use esta rotina para obter valores estimados de ''p'' para suas diferentes simulações (com o mesmo ''p'' e variando ''p'') \\
P = \left[\begin{array}{cc} p & 1-p \\ 1-p & p \end{array}\right]
- Idem anterior com \\
P=\left[\begin{array}{cc} p_1 & 1-p_1 \\ 1-p_2 & p_2 \end{array}\right]
- Escreva agora uma rotina que calcule as probabilidades dos estados da cadeia em um passo (tempo) qualquer, a partir da matriz de transição e de um vetor \nu de probabilidades iniciais. Experimente (por simulação) com diferentes valores de ''P'' e \nu
- Idem anterior para um determinado inicial.
- Resuma as conclusões que podem ser obtidas analisando os resultados das simulações anteriores
=== Parte 2 ===
- Estude o comportamento da cadeia definida pelo exemplo 1 visto em aula. \\
P=\left[\begin{array}{cccccc}
0,1 & 0,4 & 0,2 & 0,1 & 0,1 & 0,1 \\
0,2 & 0,3 & 0,2 & 0,1 & 0,1 & 0,1 \\
0,1 & 0,2 & 0,3 & 0,2 & 0,1 & 0,1 \\
0,1 & 0,1 & 0,2 & 0,3 & 0,2 & 0,1 \\
0,1 & 0,1 & 0,1 & 0,2 & 0,3 & 0,2 \\
0,1 & 0,1 & 0,1 & 0,1 & 0,4 & 0,2 \\
\end{array}\right]
- Modificar a matriz P dada colocando na ultima linha: ''(0 0 0 0 0 1)''. Estude o comportamento da cadeia.
- Estude o comportamento da cadeia com matriz de probabilidade de transição dada por\\
P=\left[\begin{array}{ccccc}
0,5 & 0,3 & 0,2 & 0,0 & 0,0 \\
0,2 & 0,3 & 0,3 & 0,2 & 0,0 \\
0,1 & 0,2 & 0,3 & 0,2 & 0,2 \\
0,0 & 0,1 & 0,2 & 0,3 & 0,4 \\
0,0 & 0,0 & 0,0 & 0,0 & 1,0 \\
\end{array}\right]
=== Parte 3 ===
- Monte a matriz de transição ''P'' e estude as características da cadeia para o exemplo genético onde os pais tem genótipos ''AA'', ''Aa'' ou ''aa''. Analise e inspecione (tb por simulação) o comportamento para diferentes valores iniciais.
==== 27/04/2011 ====
- Ver Sessões 9, 10 e 11 [[http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/|neste material online]]
- Exemplos mostrados/usados e discutidos em aula (com comandos do R)
- Exemplo **''CO2''**
data(CO2)
str(CO2)
head(CO2)
?CO2
names(CO2)
## acessando os dados
mean(CO2$uptake)
with(CO2, mean(uptake))
## resumos de uma variável
attach(CO2)
mean(uptake)
summary(uptake)
## gráficos
boxplot(uptake)
## relacionando uptake com outra variável (categórica)
boxplot(uptake ~ Treatment)
tapply(uptake, Treatment, mean)
tapply(uptake, Treatment, summary)
## relacionando uptake com outras 2 variáveis (categóricas)
tapply(uptake, list(Type, Treatment), mean)
interaction.plot(Type , Treatment, uptake, type="b")
interaction.plot(Type , Treatment, uptake, fun=median, type="b")
## mais visualizações, relacionando com outra variável numérica
plot(uptake ~ conc)
m1 <- tapply(uptake, conc, mean)
points(as.numeric(names(m1)), m1, col=2, pch=19)
by(CO2, Plant, function(x) with(x, lines(uptake ~ conc, col=gray)))
coplot(uptake ~ conc|Plant)
coplot(uptake ~ conc|Plant,show.given=FALSE)
coplot(uptake ~ conc|Plant, panel=lines, type="b",show.given=FALSE)
coplot(uptake ~ conc|Plant, panel=panel.smooth,show.given=FALSE)
require(lattice)
xyplot(uptake ~ conc|Plant)
detach(CO2)
- Dados **''mtcars''**
## obtendo informações sobre os dados (metadados)
data(mtcars)
str(mtcars)
head(mtcars)
dim(mtcars)
attach(mtcars)
## analises de uma variável quantitativa
summary(mpg)
boxplot(mpg)
hist(mpg)
rug(mpg)
hist(mpg, prob=T)
rug(mpg)
lines(density(mpg))
h1 <- hist(mpg, prob=T)
h1[1:2]
table(cut(mpg, br=seq(10, 35, by=5)))
## um gráfico **totalmente inadequado** !!!
pie(table(cut(mpg, br=seq(10, 35, by=5))))
## análises de uma variável qualitativa (nominal)
table(am)
prop.table(table(am))
pie(table(am))
which.max(table(am))
## analises de uma variável qualitativa (ordinal)
table(cyl)
prop.table(table(cyl))
barplot(table(cyl))
which.max(table(cyl))
## "cruzando" variáveis qualitativas
table(cyl, am)
plot(table(cyl, am))
barplot(table(cyl, am))
barplot(table(cyl, am), beside=T)
prop.table(table(cyl, am))
prop.table(table(cyl, am), mar=1)
prop.table(table(cyl, am), mar=2)
#
## tabela
table(am)
## grafico
pie(table(am), main="Câmbio", lab=c("automático" , "manual"))
pie(table(am), main="Câmbio", lab=c("automático" , "manual")) , col=1:2, rad=1)
## medida (moda)
am.t <- table(am)
names(am.t) <- c("automático","manual")
names(which.max(am.t))
## em porcentagens
prop.table(table(am))
## agora para numero de marchas
table(gear)
barplot(prop.table(table(gear)))
names(which.max(table(gear)))
## e agora relacionando as duas variáveis
table(am, gear)
plot(table(am, gear), main="Marchas vs Câmbio")
barplot(table(am, gear), legend=T)
barplot(table(gear, am), legend=T)
prop.table(table(am, gear), mar=1)
barplot(prop.table(table(am, gear), mar=1))
## relacionando qualitativa e quantitativa
tapply(mpg, am, mean)
tapply(mpg, am, sd)
tapply(mpg, am, summary)
tapply(mpg, am, function(x) table(cut(x, br=seq(10, 30, by=5))))
boxplot(mpg ~ am)
plot(am, mpg)
boxplot(mpg ~ am)
## relacionando variáveis quantitativas
plot(mpg ~ qsec)
lines(lowess(mpg ~ qsec))
cor(mpg, qsec)
plot(mpg ~ wt)
lines(lowess(mpg ~ wt))
cor(mpg, wt)
cor(mpg, wt, meth="sp")
plot(qsec ~ wt)
lines(lowess(qsec ~ wt))
cor(qsec, wt)
cor(qsec, wt, meth="sp")
plot(mtcars[,c(1,4,6,7)])
pairs(mtcars[,c(1,4,6,7)], panel=panel.smooth)
cor(mtcars[,c(1,4,6,7)])
cor(mtcars[,c(1,4,6,7)], meth="sp")
detach(mtcars)
==== 02/05/2011 ====
* [[http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html|Hans Rosling]] no TED Talks - como os dados podem nos ajudar a compreender e destruir mitos sobre a realidade. Procure identificar ao menos cinco pontos importantes na apresentação para discussão
==== 04/05/2011 ====
**Tópicos:**
* Análise univariada
* Medidas de posição: média, mediana, moda, média aparada, quantis
* Medidas de dispersão: amplitude, variância, desvio padrão, desvio médio, amplitude interquartílica, coeficiente de variação
* Cálculo das medidas para dados brutos e dados agrupados
* Análise bivariada
* medidas de associação: variáveis qualitativas e quantitativas
* chi^2, coeficiente de contingência, comparação de medidas resumo, covariâncas e coeficientes de correlação
**Referências adicionais e vídeos:**
* [[http://www.khanacademy.org/?video=statistics--the-average#statistics|Vídeos sobre estatística da Khan Academy]]. Vídeos relacionados com esta parte do curso (estatística descritiva)
* Statistics: The Average
* Statistics: Sample vs. Population Mean
* Statistics: Variance of a Population
* Statistics: Sample Variance
* Statistics: Standard Deviation
* Statistics: Alternate Variance Formulas
* [[http://onlinestatbook.com/2/index.html|Online Statistics]]
* [[http://onlinestatbook.com/2/graphing_distributions/graphing_distributions.html|Gráficos]]
* [[http://onlinestatbook.com/2/summarizing_distributions/summarizing_distributions.html|Resumos]]
* [[http://onlinestatbook.com/2/describing_bivariate_data/bivariate.html|Bivariado]]