Probabilidad y estadística

Distribución t de Student

Distribución t

Es una distribución de variable continua que, en ciertos casos, se aproxima a la distribución normal.

 

Se usa cuando tenemos muestras pequeñas* (menores a 30) o cuando se desconoce la desviación estándar de una población

Distribución t

Distribución t

Esta distribución requiere del cálculo de un valor, t, de acuerdo a la expresión siguiente:

t = \frac{x̄-μ}{s / \sqrt{n}}

Este valor determina que tan lejos está la media de la muestra (µ) de la media de la población (x) asumiendo una muestra aleatoria

Además del valor t, también necesitamos una que otra tabla...

Un ejemplo

Asume que hay un registro histórico de calificaciones que tiene una media de 7.0. Realiza una prueba con una muestra de 20 estudiantes que tiene una media de 7.8 con una desviación estándar de 1.2

t = \frac{x̄-μ}{s / \sqrt{n}} = \frac {7.8 - 7.0} {1.2 / \sqrt{20}} = \frac {0.8} {0.268} = 2.98

Aunque tenemos un valor t, no nos sirve para hacer ninguna inferencia por si sólo

Grados de libertad*

Los grados de libertad en la distribución t representan el número de valores independientes en una muestra que pueden variar al estimar parámetros estadísticos

gl = n - 1

Nivel de significación*

El nivel de significación (α) es un límite prestablecido relacionado al umbral de error que se puede admitir en un experimento

 

Este valor puede variar dependiendo de lo que nos importa buscar:

  • Si estamos buscando que alguna medida en nuestra muestra sea distinta a la de la población
  • Si estamos buscando que alguna medida en nuestra muestra sea mayor que la de la población
  • Si estamos buscando que alguna medida en nuestra muestra sea menor que la de la población

Hipótesis nula y alternativa

Cuando se hace investigación cuantitativa, se intenta responder una pregunta:

  • ¿Esta técnica cambia los resultados previos o los deja iguales?
  • ¿Esta máquina mejora la producción o la deja igual?
  • ¿Este sistema retrasa problemas o los deja igual?

Formalmente hablando, esa dualidad se describe mediante dos hipótesis distintas, pero conjugadas:

  • H0, o hipótesis nula, que establece que no hay cambio
  • H1, o hipótesis alterna, contradice a la hipótesis nula

Hipótesis nula y alternativa

Hipótesis nulaHipótesis alternativa
|t| > |crítico|RechazadaSoportada
|t| ≤ |crítico|No se rechazaNo soportada

Hipótesis nula y alternativa

La hipótesis nula se rechaza cuando supera los límites de las zonas críticas

Regresando al ejemplo

Asume que hay un registro histórico de calificaciones que tiene una media de 7.0. Realiza una prueba con una muestra de 20 estudiantes que tiene una media de 7.8 con una desviación estándar de 1.2

t = \frac{x̄-μ}{s / \sqrt{n}} = \frac {7.8 - 7.0} {1.2 / \sqrt{20}} = \frac {0.8} {0.268} = 2.98

Asumiendo un nivel de significación (α) de 5% y que nos interesa si la media de nuestra muestra es igual o distinta a la poblacional, podemos ver que el valor de comparación es igual a 2.093

Regresando al ejemplo

t = \frac{x̄-μ}{s / \sqrt{n}} = \frac {7.8 - 7.0} {1.2 / \sqrt{20}} = \frac {0.8} {0.268} = 2.98
\alpha = 0.05
gl = n - 1 = 19

H0: El método nuevo no tiene impacto en las calificaciones (=)

H1: El método nuevo tiene impacto en las calificaciones (≠)

crítico = (19, 0.025) = 2.093
|t| > |crítico| \Rightarrow 2.98 > 2.093 \therefore H_0 \space se \space rechaza

Regresando al ejemplo

Asume que hay un registro histórico de calificaciones que tiene una media de 7.0. Realiza una prueba con una muestra de 20 estudiantes que tiene una media de 7.8 con una desviación estándar de 1.2

t = \frac{x̄-μ}{s / \sqrt{n}} = \frac {7.8 - 7.0} {1.2 / \sqrt{20}} = \frac {0.8} {0.268} = 2.98

Asumiendo un nivel de significación (α) de 5% y que nos interesa si la media de nuestra muestra es mayor a la poblacional, podemos ver que el valor de comparación es igual a 1.7291

Regresando al ejemplo

t = \frac{x̄-μ}{s / \sqrt{n}} = \frac {7.8 - 7.0} {1.2 / \sqrt{20}} = \frac {0.8} {0.268} = 2.98
\alpha = 0.05
gl = n - 1 = 19

H0: El método nuevo no tiene impacto en las calificaciones (≤)

H1: El método nuevo hace que las calificaciones mejoren (>)

crítico = (19,0.05) = 1.7291
|t| > |crítico| \Rightarrow 2.98 > 1.7291 \therefore H_0 \space se \space rechaza

Asume que hay un registro histórico de calificaciones que tiene una media de 7.5. La escuela quiere saber si el nuevo método de enseñanza es el responsable de mejorar las calificaciones, por lo que elige una muestra de 15 estudiantes que tiene una media de 8.0 con una desviación estándar de 1. Asume un nivel de significación del 5%

Otro ejemplo

Esta prueba también se puede hacer para comparar si dos grupos relacionados son significativamente distintos entre ellos, haciendo algunos cambios al procedimiento que conocemos

¿Y para dos grupos?

t =\frac {x̄_{diff}} {\left({\frac {s_{diff}} {\sqrt{n}}} \right)}

La hipotesis nula responde si la diferencia de medias es cero y la hipótesis alternativa si es distinta de cero, mayor a cero o menor a cero

Entonces usamos:

¿Y si son independientes?

La hipotesis nula responde si la media de ambos grupos es igual y la hipótesis alternativa si son distintas, o si la primera es mayor o menor a la segunda

t = \frac {x̄_{1} - x̄_{2}} {s_{p} \sqrt{\frac 1 n_1 + \frac 1 n_2}}
s_{p} = \sqrt {\frac {(n_1 - 1) s_1^2 + (n_2 - 1) s_2^2} {n_1 + n_2 - 2}}

Probabilidad y estadística: Distribución t de Student

By Gilberto 🦁

Probabilidad y estadística: Distribución t de Student

Distribución t de Student

  • 63