Aula 2 - Estatística Descritiva
Raíra Marotta
Variável: Característica do elemento investigado no estudo de interesse.
VARIÁVEIS QUALITATIVAS têm como possíveis realizações qualidades ou atributos do indivíduo em estudo. Exemplos: sexo, estado civil, grau de instrução, etc...
As variáveis qualitativas podem ser classificadas como:
VARIÁVEIS QUANTITATIVAS tem como possíveis realizações os resultados de uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas como:
Note que, dependendo da maneira como a variável é medida, ela pode ser classificada de formas diferentes.
Exemplo: a variável idade se medida em anos poderia ser classificada como quantitativa discreta enquanto se medimos anos e dias (2,4 anos, 3,2 anos) podemos classificá-la como quantitativa contínua.
Por que é preciso classificar as variáveis de interesse corretamente?
Porque as técnicas usadas para resumir e analisar os dados dependem do tipo de variável em estudo.
Qual é o tipo das seguintes variáveis?
Quais gráficos utilizar se as variáveis forem...
2. QUANTITATIVAS?
barras, pizza (setor)
histograma, linhas, dispersão
Fonte: Censo demográfico - IBGE, 2000.
Fonte: Pnad - IBGE.
Medidas resumo são usadas para resumir ainda mais a informação vinda dos dados, fornecendo valores que representam os dados de forma global.
Medidas de Posição
Média
Mediana
Moda
Medidas de Dispersão
Variância
Desvio-padrão
Amplitude
Intervalo Interquartílico
Média aritmética simples: é a soma das observações dividida pelo número de observações
"Ponto de equilíbrio"
# Fui a feira e gastei R$ 40 reais em 5 itens.
# Quanto gastei em média por item?
40
______ = 8
5
Média aritmética ponderada: é a soma ponderada das observações dividida pelo número de observações.
# Comprei 3 blusas, por R$ 50 cada e 2 shorts, por R$ 80 cada.
# Quanto gastei em média por item?
3 x 50 + 2 x 80
_________________ = 62
5
Mediana: Observação que ocupa a posição central nos dados ordenados em ordem crescente.
Mediana
# Na turma do meu filho há 5 crianças.
# João - 4 anos
# Pedro - 3 anos
# Maria - 2 anos
# Marta - 3 anos
# José - 5 anos
Qual a mediana das idades ?
R: 3 anos
# Uma nova aluna com 2 anos entrou na turma.
# E agora? Qual a nova mediana das idades?
R: 3 anos?
# E a média mudou?
A média é afetada por valores extremos (altos ou baixos).
Fonte: Pnad/2017 - IBGE.
Distribuição da renda domiciliar per capita por cor - Brasil 2017
Moda: realização mais frequente nos dados.
O resumo de um conjunto de dados por uma única medida representativa de posição central esconde a informação sobre a variabilidade.
Grupo A: 3, 4, 5, 6, 7
Grupo B: 1, 3, 5, 7, 9
Grupo C: 5, 5, 5, 5, 5
Grupo D: 2, 5, 5, 7, 6
Grupo E: 4, 5, 5, 6, 5
Notas de grupos de alunos
Podemos dizer que os grupos têm o mesmo desempenho?
Idade de alunos de 3 turmas
Podemos dizer que as turmas são semelhantes em termos de idade?
Amplitude: é distância entre o mínimo e o máximo.
Limitações:
Variância: considera os tamanhos dos desvios de cada observação em relação à média.
Limitações:
Observação: é possível definir a variância usando o divisor (n-1) no lugar de (n); essa é a diferença entre os conceitos de variância amostral e variância populacional.
Desvio-padrão: é a raiz quadrada da variância.
Coeficiente de variação: medida de dispersão relativa (adimensional) da variação de um conjunto de dados.
Principais SEPARATRIZES:
1. Quartis
2. Decis
3. Percentis
Sejam os dados ordenados
Fonte: Pnad/2017 - IBGE.
Distribuição da renda domiciliar per capita - Brasil 2017
Alguns nomes particulares são usados para alguns quantis mais usados:
Desvio Interquartílico
Máximo
Mínimo
Mediana
Outlier
3º Quartil
1º Quartil
Moda
Média
Médiana
Moda
Moda
Média
Média
Médiana
Médiana
Assimetria positiva
Assimetria negativa
Distribuição simétrica