====== Exercícios recomendados da CE-223 Estatística computacional, 2008 ======
O [[http://leg.ufpr.br/~paulojus/ce223/ce223/|material de apoio do curso]] possui vários exercícios ao final de cada seção. Os exercicios a seguir são //complementos// aos do material.
==== Aula 25/02 ====
- Fazer um gráfico da função de probabilidade de uma v.a. X \sim Bin(n=10, p=0.03)
- Fazer um gráfico da função de densidade de probabilidade de uma v.a. X \sim N(70, 10^2)
==== Aula 27/02 ====
- Mostrar o comando para obter uma sequência dos múltiplos de 10 até 200.
- Criar um vetor ''a1'' com os elementos ''(23, 45, 21, 29, 40, 22, 29, 37, 44, 37, 31, 33, 36)''
- Extrair os elementos de ''a1'' que sejam maiores que 30.
- Extrair os elementos de ''a1'' que sejam menores que 25 ou maiores que 40. Guardar estes valores em um vetor ''a2''
- Extrair os elementos de ''a1'' que sejam maiores que 30 e menores que 40.
- Obter as posições dos elementos de ''a1'' que sejam menores que 30
- Obter a posição do maior elemento da ''a1''
- Obter a posição do menor elemento da ''a1''
- Criar um vetor ''a3'' com os elementos de ''a1'' para os quais o resto da divisão por 3 seja igual a 2. (Dica: o operador ''% %'' fornece o resto da divisão, veja exemplo a seguir).
> 14 %% 3
[1] 2
> 18 %% 3
[1] 0
> 22 %% 3
[1] 1
- Extrair os elementos de ''a1'' que sejam múltiplos de 4
- Substituir em ''a1'' os elementos iguais a 37 pelo valor 36
- Substituir em ''a1'' os elementos maiores que 40 pelo código de //valor perdido// ''NA''
- Obter as posições de ''a1'' onde estão os valores perdidos
- Crie um vetor chamado ''sexo'' com os comandos a seguir:
sexo <- c(1, 2, 2, 2, 1, 2, 1, 1, 1, 2, 2, 1, 2)
sexo <- factor(sexo, lev=1:2, lab=c("M","F"))
- Obter as posições em ''sexo'' que possuem o valor ''“M“''
- Obter os valores de ''a1'' para os quais o valor correspondente em ''sexo'' é ''“M“''
- Obter os valores de ''a1'' para os quais o valor correspondente em ''sexo'' é ''“F“''
- Descrever o resultado de cada um dos comandos a seguir:
sort(a1)
order(a1)
a1[order(a1)]
sort(a1, dec = TRUE)
- Criar um objeto ''a1.ord'' com os elementos de ''a1'' em ordem crescente
- Ordenar os objetos de ''a1'' de forma a exibir primeiro todos os elementos correpondentes a ''“M“'' e depois os correspondentes a ''“F“''
- Criar um objeto chamado ''notas'' que possua os elementos de ''a1'' com valores correspondentes de ''sexo'' sendo ''“M“'' ordenados de forma crescente, seguidos pelos correspondentes a ''“F“'' também ordenados de forma crescente. Em outras palavras, o objeto notas deverá ter as notas dos homes ordenadas seguidas pelas das mulheres também ordenadas.
- Criar um vetor com os seguinte elementos: ''(1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500)''
- Adicionar o valor ''55'' entre os valores ''50'' e ''60'' do vetor criado acima
==== Aula 25/02 ====
A //função Gamma// é uma função importante em várias áreas da matemática e com diversas aplicações em estatística, sendo dada por:\\
\Gamma(\alpha) = \int_0^{\infty} e^{-x} x^{\alpha -1} dx com \alpha > 0.
Da definição decorrem as seguintes propriedades:
* \Gamma(\alpha+1) = \alpha \Gamma(\alpha)
* Se \alpha = n é um número inteiro, então \Gamma(n) = (n-1)!
* \Gamma(1) = 1
* \Gamma(1/2) = \sqrt{\pi}
- Obtenha usando o R o resultado da combinação de 10 elementos tomados 4 a 4 de três formas diferentes:
* usando a função ''choose()''
* usando a função ''factorial()''
* usando a função ''gamma()''
- digite na linha de comando do R:
factorial
desta forma será mostrado o código da função. Note que a função ''factorial()'' na verdade utiliza a função ''gamma()'' e a segunda propriedade mencionada acima para processar os cálculos.
- Obtenha um gráfico da função de densidade de probabilidade da distribuição \chi^2, três graus de liberdade, de duas formas diferentes:
* utilizando operações algébricas com a expressão da f.d.p.
* utilizando a função ''dchisq()''
- Obtenha um gráfico de formas análogas às do exercício anterior para a distribuição ''t'' com 9 graus de liberdade.
- Considere o exercício da distribuição binomial da primeira aula do curso e discutido na aula desta semana. Experimente utilizar o comando ''plot()'' com o uso do argumento ''type'' com cada uma das opções: ''type = “p“'', ''type = “l“'', ''type = “b“'', ''type = “c“'', ''type = “o“'', ''type = “h“'', ''type = “s“'', ''type = “S“'', ''type = “n“''. Verifique os resultados produzidos e:
* descreva o tipo de gráfico produzido com cada opção
* discuta exemplos de situações onde o uso de cada um destes tipos de gráficos seria adequado
==== Aula 30/04 ====
- Ilustre via simulação o seguinte resultados,
* Se $Z \sim N(0,1)$ então $Z^2 \sim\chi^2_1$.
* Se $Z_1,\dots,Z_n\sim N(0,1)$ então \sum Z_i^2 \sim\chi^2_n$.
* Se $Y_1,\dots,Y_n\sim N(\mu,\sigma^2)$ então $(1/n)\sum Y_i\sim N(\mu,\sigma^2/n)$.
* Se $Y_1,\dots,Y_n\sim N(\mu,\sigma^2)$ e $S2 = \sum(Y_i-\bar{Y})^2/(n-1)$ então $V = (n-1)S2 ∕ \sigma^2\sim\chi^2_{n-1}$. Compare os valores teóricos $E[S2] = \sigma^2$ e $Var[S2] = 2\sigma^2 / (n-1)$ com os valores obtidos na simulação.
- Considere uma distribuição N(0,1) e amostras de tamanho n = 20 desta distribuição. Sejam dois estimadores: T1, a média amostral e T2 a mediana amostral. Avalie e compare através de simulações a eficiência dos dois estimadores. É possível identificar o mais eficiente? Qual a eficiência relativa? Repita o procedimento com diferentes tamanhos de amostra e verifique o efeito do tamanho da amostra na eficiência relativa.
- Ilustrar o resultado que diz que o quociente de duas variáveis independentes com distribuição qui-quadrado tem distribuição F.
==== Aula 07/05 ====
Este exercício tem como objetivo treinar o uso do \LaTeX na confecção de um relatório de análise estatística.
Considere o conjunto de dados {{disciplinas:milsa.dat|''milsa''}} do livro de Bussab e Moretin. Confeccione um texto com um relatório de análise destes dados que contenha:
- estatísticas descritivas de cada uma das variáveis. Colocar as medidas resumo ao longo do texto tal como em:
... na amostra de 200 pessoas observou-se que 134 (67%) eram do sexo masculino e 66 (33%) do sexo feminino ...
- pelo menos duas figuras sendo que uma deve conter apenas um gráfico e outra deve conter dois gráficos lado a lado,
- uma tabela de frequências para uma variável quantitativa
- pelo uma tabela de associação entre duas variáveis qualitativas, bem como a medida de \chi^2 associada a essa tabela.
- pelo menos três formulas referentes ao que está sendo calculado para o relatório.
As análises devem ser feitas no programa R. Guarde o arquivo com código/comandos utilizado para gerar os resultados incluídos no relatório.