Probabilidad
y
Estadística I
Estadística
Se llama Estadística a la rama de las matemáticas que se sirve de un conjunto de métodos, normas, reglas y principios para la observación, toma, organización,
descripción, presentación y análisis del comportamiento de un grupo de datos para la conclusión sobre un experimento o fenómeno.
Estadística
Rama de las matemáticas que estudia los datos cuantitativos reunidos por observación con el fin de estudiar y comparar las fuentes de varianza de los
fenómenos, de aceptar o de rechazar las hipótesis que afectan a las relaciones entre los fenómenos y de ayudar a hacer unas inferencias a partir de las observaciones. Kerlinger De Landsheere.
Estadística
Es la técnica o proceso matemático de recolección, descripción, organización, análisis e interpretación de datos numéricos. Constituye un instrumento fundamental de medida y de investigación dada su capacidad de expresión cuantitativa.
Mario Tamayo
Estadística
En el lenguaje corriente, el término se suele usar en dos sentidos diferentes.
En plural (estadísticas), como sinónimo de ordenación de datos numéricos (por ejemplo, estadísticas de viviendas construidas por intermedio del banco
hipotecario);
en singular, el término se aplica a la ciencia estadística, cuyo objeto es el de recopilar, presentar, analizar e interpretar datos, referentes a hechos, con el fin
de estudiar fenómenos susceptibles de expresión numérica. Ander Egg.
Datos históricos de la estadística
Gottfried Achenwall (1719 –1772)
Universidad de Leipzig
escribió sobre
el descubrimiento de una nueva ciencia que llamó Estadística y la definió como “el
conocimiento profundo de la situación respectiva y comparativa de cada Estado”.
Achenwall y sus seguidores estructuraron los métodos estadísticos que se orientaron a
investigar, medir y comparar las riquezas de las naciones
La utilidad de la estadística
Clasificación de la Estadística
La estadística tiene básicamente dos divisiones:
N
n
Población
Muestra
Las características de la muestra
dependen del criterio del muestreo empleado para su
determinación. Sin embargo, para que una muestra sea representativa de la población, ésta deberá contener aproximadamente entre el 5 % y el 10 % de los datos de la
población cuando ésta es finita, además los elementos de la muestra deben ser escogidos al azar (a la suerte) y se deben observar todas las características que se
observan en la población.
+Datos Internos
+Datos Externos
Se le llama Experimento a toda acción o prueba que se realiza con el fin de observar su resultado.
Experimento Determinista
Experimento Aleatorio, Probabilista, casual o de azar
MÉTODOS
DE
MUESTREO
El término censo no sólo se aplica a aquellos estudios que comprenden todas las unidades del país
La Distribución o Tabla de Frecuencias:
Es la representación conjunta de los datos en forma de tabla o subgrupo de datos correspondientes a un fenómeno en estudio y su ordenamiento en base al número de observaciones que
corresponden a cada dato o a cada grupo de datos, adecuados según
cronología, geografía, análisis cuantitativo o cualitativo.
Los principales elementos de una tabla estadística son:
Título, unidades, encabezado, cuerpo o contenido, nota de pie y referencias.
Se elabora colocando en la primera columna los datos diferentes o subgrupos de datos (llamados clases o intervalos de clase) y en la columna siguiente el número de observaciones que corresponden a cada dato o a cada grupo de datos (llamada frecuencia).
Probabilidad y estadística II
Planeará y resolverá problemas reales mediante el empleo de las técnicas estadísticas univariantes más usuales, tanto paramétricas en su ámbito profesional.
OBJETIVO GENERAL DEL
CURSO
1. Introducción a la estadística analítica o inferencial
-
-
Concepto de probabilidad y reglas para su cálculo.
-
El teorema del binomio y la distribución.
-
Objetivo de la estadística analítica.
-
ESQUEMA DEL CURSO
2. La elaboración de una prueba de hipótesis.
2.1 Concepto de nivel de significancia y de grados de libertad.
2.2 Pruebas de hipótesis bilaterales y unilaterales.
2.3 Ejemplo: la prueba sobre la medida de una población y el error estándar.
ESQUEMA DEL CURSO
3. Prueba de hipótesis para muestras dependientes e independientes.
ESQUEMA DEL CURSO
4. La distribución muestra la T de student (aplicación de la tabla).
ESQUEMA DEL CURSO
5. La formula del estadístico T y las condiciones previas para su aplicación.
ESQUEMA DEL CURSO
Concepto de probabilidad y reglas para su cálculo.
Probabilidad
La probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y suele expresarse como un número entre 0 y 1.
Teorema del Binomio
nivel de significancia y de grados de libertad.
Prueba de Hipótesis Estadísticas
¿Qué es una prueba de hipótesis?
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población dependiendo de la evidencia proporcionada por una muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa.
H0
HA
H0
La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia".
HA
La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar.
Ejemplo de cómo realizar una prueba de hipótesis básica
el gerente de una fábrica de tuberías desea determinar si el diámetro promedio de los tubos es diferente de 5 cm. El gerente sigue los pasos básicos para realizar una prueba de hipótesis.
Ejemplo
Especificar las hipótesis.
En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ = 5
Luego, el gerente elige entre las siguientes hipótesis alternativas:
Condición que se probará | Hipótesis alternativa |
---|---|
La media de la población es menor que el objetivo. | unilateral: μ < 5 |
La media de la población es mayor que el objetivo. | unilateral: μ > 5 |
La media de la población es diferente del objetivo. | bilateral: μ ≠ 5 |
Condición que se probará | Hipótesis alternativa |
---|---|
La media de la población es menor que el objetivo. | unilateral: μ < 5 |
La media de la población es mayor que el objetivo. | unilateral: μ > 5 |
La media de la población es diferente del objetivo. | bilateral: μ ≠ 5 |
H1: μ ≠ 5
H0: μ = 5
Elegir un nivel de significancia (también denominado alfa o α).
El gerente selecciona un nivel de significancia de 0.05, que es el nivel de significancia más utilizado.
Ejemplo
alfa = 0.05
Determinar la potencia y el tamaño de la muestra para la prueba.
El gerente utiliza un cálculo de potencia y tamaño de la muestra para determinar cuántos tubos tiene que medir para tener una buena probabilidad de detectar una diferencia de 0.1 cm o más con respecto al diámetro objetivo.
Recolectar los datos.
Recoge una muestra de tubos y mide los diámetros.
Comparar el valor p de la prueba con el nivel de significancia
Después de realizar la prueba de hipótesis, el gerente obtiene un valor p de 0.004. El valor p es menor que el nivel de significancia de 0.05
Ejemplo
Decidir si rechazar o no rechazar la hipótesis nula.
El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los tubos no es igual a 5 cm.
Ejemplo
Ejercicio
vs
99 | 98 |
99 | 96 |
98 | 96 |
97 | 95 |
90 | 85 |
85 | 80 |
84 | 79 |
82 | 78 |
81 | 75 |
79 | 73 |
79 | 72 |
68 | 69 |
61 | 67 |
60 | 62 |
56 | 60 |
A
B
0 | A | B |
---|---|---|
N | 15 | 15 |
Shapiro-Wilk W | 0.914 | 0.9283 |
p(normal) | 0.1559 | 0.2569 |
Jarque-Bera JB | 0.9797 | 0.9414 |
p(normal) | 0.6127 | 0.6246 |
p(Monte Carlo) | 0.3771 | 0.4033 |
Chi^2 | 0.2 | 0.2 |
p(normal) | 0.65472 | 0.65472 |
Chi^2 OK (N>20) | NO | NO |
Anderson-Darling A | 0.4522 | 0.3972 |
p(normal) | 0.2344 | 0.3235 |
alfa = 0.05
> = < ≠
SAMPLES | ||||
---|---|---|---|---|
A | B | |||
N: | 15 | N: | 15 | |
Mean: | 81.2 | Mean: | 79 | |
95%: | (73.172 89.228) | 95%: | (72.014 85.986) | |
Var.: | 210.17 | Var.: | 159.14 | |
TESTS | ||||
F: | 1.3206 | p(same): | 0.60983 | |
t: | 0.44337 | p(same): | 0.6609 |
alfa = 0.05
> = < ≠
Prueba t
alfa = 0.05
> = < ≠
Probabilidad y Estadística I
By Tuxtla Nauta
Probabilidad y Estadística I
- 393