Prof. Dr. Pedro Costa Ferreira
Produção de parafusos. Uma fábrica produz parafusos, que devem ter diâmetros dentro de certas especificações. Ao medirmos os diâmetros de 100 parafusos produzidos ao acaso existirão variações individuais;
Em geral um número em Estatística não é apenas um número! A ele associamos uma medida de incerteza ou variabilidade.
População e Amostra
teste
População: eleitores na cidade do Rio de Janeiro.
Amostra: 650 eleitores escolhidos aleatoriamente (ao acaso).
Característica de interesse: percentual de eleitores que
planejam votar num candidato X nas próximas eleições.
População: automóveis produzidos no Brasil entre 1997 e 2002.
Amostra: 10000 carros escolhidos aleatoriamente dentre os sujeitos a recall das montadoras.
Característica de interesse: verificar se o proprietário do carro respondeu ao chamado de recall da fábrica.
1
2
População: todos os domicílios com TV na cidade do Rio de Janeiro.
Amostra: 1000 domicílios com TV escolhidos ao acaso.
Característica de interesse: percentual de audiência de cada emissora de TV num certo dia da semana no horário de 18 às 22 horas.
Em resumo: A partir de uma amostra coletamos informações que nos permitem aprender alguma coisa interessante sobre a população.
3
Pode-se provar que, para populações muito grandes, uma amostra de cerca de 600 ou 1000 "indivíduos" fornece resultados bastante confiáveis sobre as características da população.
Você pode simplesmente descrever estes dados numéricos através de gráficos e tabelas. Isto é chamado de estatística descritiva. A maioria das pesquisas de mercado faz só isso, que é sem dúvida, muito importante.
Existem duas possibilidades:
1
Você pode tentar tirar conclusões sobre as características da população a partir dos dados observados na amostra.
Isso se chama estatística inferencial (ou simplesmente estatística!). Para que a gente consiga fazer isso, é necessário ter uma noção bastante abrangente de Probabilidades.
2
Esta última depende da especificação de modelos matemáticos baseados numa noção fundamental, que é a de "probabilidade".
Note que este histograma usa intervalos diferentes dos especificados na tabela de freqüência mostrada anteriormente
Histograma – Retorno diário do preço do petróleo WTI – 01/1991 a 08/2006
exemplo: média e mediana amostrais.
exemplo: desvio padrão e variância amostrais, amplitude amostral.
Se n é par
Se n é impar
Se agora os dados são: 1,2,3,4,45, a média amostral é: (1+2+3+4+45)/5 = 11, mas a mediana amostral continua sendo 3.
Precisamos também saber o quanto as observações na amostra estão "espalhadas";
Tem maior dispersão:
é mais “espalhada”
Terceiro Quartil: Q3 – é o percentil 75%
5% dos retornos abaixo de -3.53%
90% dos retornos abaixo de +2.51%
As posições relativas quartil 1, quartil 2 e quartil 3 dão uma noção da assimetria da distribuição;
Os comprimentos das caudas são dados pelas linhas que vão do retângulo aos valores remotos e pelos valores atípicos (outliers), que são, geralmente representados por asterísco.
O coeficiente de assimetria amostral é definido como:
Se o coeficiente é zero, seus dados são simétricos em torno da média.
Se o coeficiente é positivo (assimetria positiva), existem valores “grandes” maiores que a média => existe uma cauda comprida para a direita.
Dados com assimetria positiva
Dados simétricos
É uma medida do “achatamento” de uma distribuição de probabilidade.
Distribuições de retornos de ativos financeiros geralmente tem a “cara” de uma Normal, mas com excesso de curtose!
Ao lado, a curva B é a normal padrão
e a curva A tem excesso de curtose.