Raíra Marotta
Estatística
Curso Big Data e Data Science
Aula 4 - Probabilidade
Introdução
- A Teoria das Probabilidades pode ser pensada como a teoria matemática utilizada para estudar a incerteza em fenômenos aleatórios.
- Fenômenos aleatórios são situações ou acontecimentos cujos resultados não podem ser previstos com certeza.
Exemplo:
Jogar uma moeda observar a face virada para cima
Conceitos Básicos
Como quantificar incerteza?
Impossível
1 chance em 6
Improvável
50%
4 chances em 5
Provável
Certo
Conceitos Básicos
- Um espaço amostral Ω: conjunto de todos os resultados possíveis de um experimento.
- Uma probabilidade P(ω) para cada resultado possível ω ∈ Ω.
MODELO TEÓRICO
Exemplo do dado:
Ω: {1,2,3,4,5,6}
P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6
Definições
- Se A é o evento de interesse e cada elemento de Ω é equiprovável, temos:
DEFINIÇÃO CLÁSSICA
número de
número de casos possíveis
P(A) =
Definições
- Suponha que um experimento é repetido n vezes, e seja A um evento associado ao experimento:
DEFINIÇÃO FREQUENTISTA
número de vezes que A ocorreu
número de repetições do experimento
P(A) =
Axiomas de Probabilidade
- 0 P(A) 1
- P(Ω) = 1
- Se A e B são mutuamente excludentes (A ∩ B = ∅), então P(A ∪ B) = P(A) + P(B);
A partir dos axiomas temos que:
P(A ∪ B) = P(A) + P(B) − P(A ∩ B);
P(A') = 1 − P(A);
Se ∅ denota o conjunto vazio então P(∅) = 0;
Conceitos Importantes
Ω
A
B
P(A)
A
B
P(A)
A
B
P(A')
A
B
P(B')
P(A ∩ B')
P(A ∩ B)
INDEPENDÊNCIA
Se dois eventos são independentes, então a probabilidade de ocorrência de ambos é igual ao produto de suas probabilidades individuais, ou seja,
P(
Exemplo - Duas moedas equilibradas são jogadas. Qual a probabilidade de ambas darem cara?
P( cara & cara) = P(cara)*P(cara)
= (1/2)*(1/2)
= 1/4
Conceitos Importantes
PROBABILIDADE CONDICIONAL
Se dois eventos são independentes, então a probabilidade de ocorrência de ambos é igual ao produto de suas probabilidades individuais, ou seja,
P(A ∩ B)
P(A|B) =
P(B)
Conceitos Importantes
P(A|B)
Dado
Já ocorreu
PROBABILIDADE CONDICIONAL
Marca A | Marca B | Marca C | Total | |
---|---|---|---|---|
Homens | 136 | 92 | 248 | 476 |
Mulheres | 102 | 195 | 62 | 359 |
Total | 238 | 287 | 310 | 835 |
Conceitos Importantes
Baseando-se nessas frequências e sorteando-se uma pessoa ao acaso
- Qual a probabilidade de ser uma mulher?
- Qual a probabilidade de ser mulher dado que preferiu a marca C?
PROBABILIDADE CONDICIONAL
Conceitos Importantes
- Se o evento A não depende de B, então a probabilidade de A ocorrer não é afetada, ou seja,
- Se isso for verdade, podemos afirmar que A e B são eventos independentes. Assim,
P(A|B) = P(A).
P(A ∩ B) = P(A|B) = P(A)P(B).
TEOREMA DE BAYES
Conceitos Importantes
- Desenvolvido por Thomas Bayes
- Fundador dos pilares da estatística bayesiana.
- Dado dois eventos A e B
P(B|A)*P(A)
P(A ∩ B) =
P(B)
TEOREMA DE BAYES
Conceitos Importantes
- Pela propriedade dos complementares:
P(B) = P(B ∩ A) + P(B ∩ A')
= P(B|A)*P(A) + P(B|A')*P(A')
- Outra versão do Teorema de Bayes
P(B|A)*P(A)
P(A ∩ B) =
P(B|A)*P(A) + P(B|A')*P(A')
Conceitos Importantes
Variável aleatória: é uma função que associa um único valor numérico a cada resultado em um espaço amostral.
Exemplo: jogar duas moedas e observar a face voltada para cima.
X = número de caras
Conceitos Importantes
Valor Esperado: representa a média da distribuição.
Função densidade: função que descreve a probabilidade relativa de uma variável aleatória tomar um dado valor.
Função de distribuição acumulada: função que descreve a probabilidade da variável aleatória X assumir um valor ou menor que um determinado x
Conceitos Importantes
Variáveis Aleatórias
DISCRETAS: variável que possui número de valores possíveis finito ou infinito enumerável.
Função de distribuição acumulada:
Valor Esperado:
Variáveis Aleatórias
CONTÍNUAS: variável que assume valores dentro do conjunto dos números reais.
Função de distribuição acumulada:
Valor Esperado:
Distribuições de Probabilidade
Variáveis aleatórias discretas
- Bernoulli
- Binomial
- Poisson
- Multinomial
Variáveis aleatórias contínuas
- Normal
- t-student
- Exponencial
- Gama
- Beta
- Uniforme
MODELOS PROBABILÍSTICOS: procuram descrever vários tipos de variáveis aleatórias - são as distribuições de probabilidade de variáveis aleatórias
Distribuições de Probabilidade
MODELO BERNOULLI: a variável resposta X é do tipo sucesso ou fracasso.
Distribuições de Probabilidade
MODELO BINOMIAL: a variável aleatória X contém o número de tentativas que resultam em sucesso.
Distribuições de Probabilidade
MODELO POISSON: muito utilizado para contagens quando o número de observações é alto.
Distribuições de Probabilidade
MODELO NORMAL: muito comum e o mais importante em toda a estatística. Chamado também de modelo Gaussiano.
Infnet - Aula 4
By Raíra Marotta
Infnet - Aula 4
- 302