Raíra Marotta

Estatística

Curso Big Data e Data Science  INFNET

Aula 4 - Probabilidade

Introdução

  • A Teoria das Probabilidades pode ser pensada como a teoria matemática utilizada para estudar a incerteza em fenômenos aleatórios.
  • Fenômenos aleatórios são situações ou acontecimentos cujos resultados não podem ser previstos com certeza.

Exemplo:

Jogar uma moeda observar a face virada para cima

 

Conceitos Básicos

 Como quantificar incerteza?

Impossível

1 chance em 6

Improvável

50%

4 chances em 5

Provável

Certo

Conceitos Básicos

  • Um espaço amostral Ω: conjunto de todos os resultados possíveis de um experimento. 

 

  • Uma probabilidade P(ω) para cada resultado possível ω ∈ Ω. 

MODELO TEÓRICO

Exemplo do dado:

Ω: {1,2,3,4,5,6}

P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6

Definições

  • Se A é o evento de interesse e cada elemento de Ω é equiprovável, temos:

DEFINIÇÃO CLÁSSICA

     número de casos favoráveis

número de casos possíveis

P(A) =

Definições

  • Suponha que um experimento é repetido n vezes, e seja A um evento associado ao experimento:

DEFINIÇÃO FREQUENTISTA

número de vezes que A ocorreu

número de repetições do experimento

P(A) =

Axiomas de Probabilidade

  • 0        P(A)        1
\leq
\leq
  • P(Ω) = 1
  • Se A e B são mutuamente excludentes (A ∩ B = ∅), então P(A ∪ B) = P(A) + P(B);

A partir dos axiomas temos que:

P(A ∪ B) = P(A) + P(B) − P(A ∩ B);

 P(A') = 1 − P(A);

Se ∅ denota o conjunto vazio então P(∅) = 0;

Conceitos Importantes

A

B

P(A)

A

B

P(A)

A

B

P(A')

A

B

P(B')

P(A B')

P(A  B)

INDEPENDÊNCIA

Se dois eventos são independentes, então a probabilidade de ocorrência de ambos é igual ao produto de suas probabilidades individuais, ou seja,

P(A ∩ B) = P(A)P(B).

Exemplo - Duas moedas equilibradas são jogadas. Qual a probabilidade de ambas darem cara? 

P( cara & cara)  = P(cara)*P(cara)

                                  = (1/2)*(1/2)

                                  = 1/4

Conceitos Importantes

PROBABILIDADE CONDICIONAL

Se dois eventos são independentes, então a probabilidade de ocorrência de ambos é igual ao produto de suas probabilidades individuais, ou seja,

P(A ∩ B) 

P(A|B) =

P(B) 

Conceitos Importantes

 

P(A|B)

 

Dado

Já ocorreu

PROBABILIDADE CONDICIONAL

Marca A Marca B Marca C Total
Homens 136 92 248 476
Mulheres 102 195 62 359
Total 238 287 310 835

Conceitos Importantes

Baseando-se nessas frequências e sorteando-se uma pessoa ao acaso

  • Qual a probabilidade de ser uma mulher?
  • Qual a probabilidade de ser mulher dado que preferiu  a marca C?

PROBABILIDADE CONDICIONAL

Conceitos Importantes

  • Se o evento A não depende de B, então a probabilidade de A ocorrer não é afetada, ou seja, 



  • Se isso for verdade, podemos afirmar que A e B são eventos independentes. Assim, 

P(A|B) = P(A).

P(A ∩ B) = P(A|B)  = P(A)P(B).

TEOREMA DE BAYES

Conceitos Importantes

  • Desenvolvido por Thomas Bayes

 

  • Fundador dos pilares da estatística bayesiana.

 

  • Dado dois eventos A e B 

P(B|A)*P(A)

P(A ∩ B) =

P(B)

TEOREMA DE BAYES

Conceitos Importantes

  • Pela propriedade dos complementares:

P(B) = P(B ∩ A) +   P(B ∩ A')

= P(B|A)*P(A) + P(B|A')*P(A')

  • Outra versão do Teorema de Bayes

P(B|A)*P(A)

P(A ∩ B) =

P(B|A)*P(A) + P(B|A')*P(A')

Conceitos Importantes

Variável aleatória: é uma função que associa um único valor numérico a cada resultado em um espaço amostral.

Exemplo: jogar duas moedas e observar a face voltada para cima.

 

X = número de caras

Conceitos Importantes

Valor Esperado: representa a média da distribuição.

Função densidade:  função que descreve a probabilidade relativa de uma variável aleatória tomar um dado valor.

Função de distribuição acumulada:  função que descreve a probabilidade da variável aleatória X assumir um valor ou menor  que um determinado x

Conceitos Importantes

Variáveis Aleatórias

DISCRETAS: variável que possui  número de valores possíveis finito ou infinito enumerável.

p(x_i) \geq0, \forall i, \\ \sum_{i=1}^{\infty}p(x_i) = 1

Função de distribuição acumulada:

F(x) = P(X \leq x) = \sum_{j}p(x_j)

Valor Esperado:

E(X) = \sum_{i=1}^{\infty}x_ip(x_i)

Variáveis Aleatórias

CONTÍNUAS: variável que assume valores dentro do conjunto dos números reais.

f(x) \geq 0, \forall x \\ \int_{-\infty}^{\infty}f(x)dx = 1 \\

Função de distribuição acumulada:

F(x) = P(X \leq x) = \int_{-\infty}^{x}f(t)dt, x \in \mathbb{R}

Valor Esperado:

E(X) = \int_{-\infty}^{\infty}xf(x)dx
P(a < X < b) = \int_{a}^{b}f(x)dx

 Distribuições de Probabilidade

Variáveis aleatórias discretas

  • Bernoulli
  • Binomial
  • Poisson
  • Multinomial

Variáveis aleatórias contínuas

  • Normal
  • t-student
  • Exponencial
  • Gama
  • Beta
  • Uniforme

MODELOS PROBABILÍSTICOS: procuram descrever vários tipos de variáveis aleatórias - são as distribuições de probabilidade de variáveis aleatórias

 Distribuições de Probabilidade

MODELO BERNOULLI: a variável resposta X é do tipo sucesso ou fracasso.

X \sim Bernoulli(p) \hspace{0.4cm} \Longrightarrow \hspace{0.4cm} P(X=k) = p^k(1-p)^{1-k} \textrm{ , } k=0,1

 Distribuições de Probabilidade

MODELO BINOMIAL: a variável aleatória X contém o número de tentativas que resultam em sucesso.

X \sim Binomial(n,p) \hspace{0.3cm} \Longrightarrow \hspace{0.3cm} P(X=k) = {n\choose k} p^k(1-p)^{1-k} \textrm{ , } k=0,1,\ldots,n.

 Distribuições de Probabilidade

MODELO POISSON: muito utilizado para contagens quando o número de observações é alto.

X \sim Poisson(\lambda) \hspace{0.3cm} \Longrightarrow \hspace{0.3cm} P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!} \textrm{ , } k > 0.

 Distribuições de Probabilidade

MODELO NORMAL: muito comum e o mais importante em toda a estatística. Chamado também de modelo Gaussiano.

X \sim Normal(\mu,\sigma^2) \hspace{0.3cm} \Longrightarrow \hspace{0.3cm} f(k) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{\frac{-1}{2\sigma^2}(k-\mu)^2}\textrm{ , } -\infty < k < \infty.

Infnet - Aula 4

By Raíra Marotta

Infnet - Aula 4

  • 302