Raíra Marotta
Web Intelligence e Analítica de Dados - WIDA
Aula 5 - Inferência Testes
Teste de hipóteses:
Hipóteses:
P-valor:
é o menor nível de significância para o qual a hipótese nula é rejeitada.
Nível de significância:
P-valor:
Comumente, o p-valor é utilizado para avaliar a significância de um teste de hipóteses
Teste de hipóteses: podem ser bilaterais ou unilaterais.
Exemplo para a média populacional
Teste t
Suponha que estamos interessados em investigar a média populacional de um determinado fenômeno.
Onde s representa o valor estimado do desvio padrão e representa o valor estimado da média.
Utilizamos este teste quando desconhecemos o valor verdadeiro da variância populacional e a amostra é pequena n < 30
Exemplo: Verificar a quantidade de calorias num determinado produto. A empresa informa que a média de calorias de seu produto é de 30 kcal/g, mas a ANVISA afirma que é maior.
## No R:
# amostra de 25 produtos
calorias = c(30.05,29.38,28.45,31.22,31.07,34.44,34.50,34.48,31.75,30.59,
31.92,31.76,30.25,33.28,33.40,31.46,31.43,32.92,
29.91,33.63,27.98,33.07,31.01,29.85,29.70)
t.test(calorias,mu=30,alternative ="greater")
O
Teste para a proporção
Suponha que estamos interessados em investigar a média populacional de um determinado fenômeno.
Onde s representa o valor estimado do desvio padrão e representa o valor estimado da proporção.
Exemplo: avaliar se proporção de crianças do sexo masculino nascidas em 2016 é de 50%.
Segundo dados do Registro Civil (IBGE), dos 2.803.080 nascimentos 1.435.631 foram de homens
Exemplo: tianeptina é um antidepressivo. Aplicou-se a droga em dois grupos de pacientes e quantificou o nível de depressão através da escala de Montgomery-Asberg, em que os valores maiores indicam maior gravidade da depressão.
## No R:
placebo <- c(6,33,21,26,10,29,33,29,37,15,2,21,7,26,13,18)
tianeptina <- c(10,8,17,4,17,14,9,4,21,3,7,10,29,13,14,2)
t.test(tianeptina,placebo,alternative ="less")
Welch Two Sample t-test
data: tianeptina and placebo
t = -2.7788, df = 26.343, p-value = 0.004965
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -3.478563
sample estimates:
mean of x mean of y
11.375 20.375
Exemplo: tianeptina é um antidepressivo. Aplicou-se a droga em dois grupos de pacientes e quantificou o nível de depressão através da escala de Montgomery-Asberg, em que os valores maiores indicam maior gravidade da depressão.
## No R:
placebo <- c(6,33,21,26,10,29,33,29,37,15,2,21,7,26,13,18)
tianeptina <- c(10,8,17,4,17,14,9,4,21,3,7,10,29,13,14,2)
t.test(tianeptina,placebo,alternative ="less")
Welch Two Sample t-test
data: tianeptina and placebo
t = -2.7788, df = 26.343, p-value = 0.004965
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -3.478563
sample estimates:
mean of x mean of y
11.375 20.375