Prueba de Hipotesis para Muestras Pequeñas.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

CLASE SEMANA 15 SESION 1

INFERENCIA ESTADISTICA

PRUEBA DE HIPOTESIS PARA DIFERENCIAS DE DOS MEDIAS


PARA MUESTRAS PEQUEÑAS( 𝑛1 + 𝑛2 < 30)

Cuando las varianzas poblacionales no se conocen, deben considerarse los siguientes aspectos:

A) Las poblaciones deben seguir una ley normal.


B) Las varianzas poblacionales 𝜎12 𝑦 𝜎22 deben estimarse con S1 y S2 de los datos muestrales.
C) La distribución t-student se utiliza para la prueba con un nivel de significación ∞ y grados de
libertad g.l.

Se consideran dos tipos de prueba:


I) Suponer que varianzas poblacionales iguales 𝜎12 = 𝜎22
II) Suponer que varianzas poblacionales distintas. 𝜎12 ≠ 𝜎22
CASO I ( SUPONER VARIANZAS IGUALES ( 𝝈𝟐𝟏 = 𝝈𝟐𝟐 )

Cálculos necesarios:

1 La varianza común. 𝑆𝑐2

Cuando se supone que 𝜎12 = 𝜎22 , se debe estimar la varianza común:

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑐2 =
𝑛1 + 𝑛2 − 2

2. El estadístico de contraste 𝑡𝑐

𝑋̅1 − 𝑋̅2
𝑡𝑐 =
𝑆𝑐2 𝑆𝑐2

𝑛1 + 𝑛2

3. Grados de libertad g.l= 𝑣 = 𝑛1 + 𝑛2 − 2

Siempre se aplican los 5 pasos para prueba de hipótesis.


Ejemplo 1. Caso 𝝈𝟐𝟏 = 𝝈𝟐𝟐
Dos muestras aleatorias se extraen de dos poblaciones normales, cuyas varianzas son iguales pero
desconocidas. Los datos muestrales son:

𝑋̅1 = 20 𝑛1 = 10 1480
𝑆12 =
9
𝑋̅2 = 15.8 𝑛2 = 10 1425
𝑆22 =
9

Probar la hipótesis de igualdad de medias


(usamos estadístico t ya que ( 𝑛1 + 𝑛2 < 30)

Paso 1. Planteamiento de hipótesis:


𝐻𝑜 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
Paso 2: Calcular estadístico de contraste:
Varianza común:
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑐2 =
𝑛1 + 𝑛2 − 2

1480 1425
(10 − 1) ( (10 − 1) (
𝑆𝑐2 = 9 ) + 9 ) =
2905
10 + 10 − 2 18
𝑋̅1 − 𝑋̅2
𝑡𝑐 =
2 2
√𝑆𝑐 + 𝑆𝑐
𝑛1 𝑛2
20 − 15.8
𝑡𝑐 = = 0.74
2905 2905
√( 18 ) ( 18 )
10 + 10
Paso 3: Zona de aceptación / rechazo.
Grados de libertad. 𝑣 = 10 + 10 − 2 = 18
Paso 4. Criterio de decisión:
𝑡𝑐 = 0.74
Valor frontera 𝑡∞ = ± 2.101
2

Decisión: Aceptar Ho, ya que −𝑍∞ < 𝑍𝑐 < 𝑍∞


2 2

Paso 5: Conclusión:
Las medias son iguales.

Ejemplo 2. Caso 𝝈𝟐𝟏 = 𝝈𝟐𝟐

Considere un nuevo software que se supone ayuda a los analistas de sistemas a reducir el tiempo
requerido para diseñar, elaborar y poner en marcha un sistema de información. Para evaluar las ventajas
del nuevo software, se toma una muestra de 24 analistas de sistemas. A cada analista se le da
información sobre un sistema de información hipotético. A 12 de ellos se les pide que elaboren el
sistema de información usando la tecnología existente y a los otros 12 analistas se les capacita para usar
el nuevo software y se les pide que lo empleen para elaborar el Sistema de información. Los datos obtenidos son:

Grupo 01 Grupo 02
𝑛1 = 12 𝑛2 = 12
̅
𝑋1 = 325 ℎ𝑜𝑟𝑎𝑠 ̅
𝑋2 = 286 ℎ𝑜𝑟𝑎𝑠
𝑆1 = 40 ℎ𝑜𝑟𝑎𝑠 𝑆2 = 44 ℎ𝑜𝑟𝑎𝑠

Considere que las variazas pobalcionales son desconocidas, pero se pueden suponer iguales.
¿Se puede afirmar que el grupo 02 emplea menos tiempo en promedio? Use alfa 10%

Paso 1. Planteamiento de hipótesis:


𝐻𝑜 : 𝜇1 ≤ 𝜇2
𝐻1 : 𝜇1 > 𝜇2
Paso 2: Calcular estadístico de contraste:
(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
Varianza común: 𝑆𝑐2 =
𝑛1 +𝑛2 −2

(12 − 1)(40)2 + (12 − 1)(44)2


𝑆𝑐2 = = 1768
12 + 12 − 2

𝑋̅1 − 𝑋̅2
𝑡𝑐 =
𝑆2 𝑆2
√ 𝑐 + 𝑐
𝑛1 𝑛2
325 − 286
𝑡𝑐 = = 2.2719
√1768 + 1768
12 12
Paso 3: Zona de aceptación / rechazo.
Grados de libertad. 𝑣 = 12 + 12 − 2 = 22 : .El nivel de significancia es 0.01 encontremos zona de aceptación
y de rechazo.
𝑔. 𝑙. = 22, ∞ = 0.10

Paso 4. Criterio de decisión:


𝑡𝑐 = 2.2719
Valor frontera 𝑡∞ = 1.321
Decisión: Rechazar r Ho, ya que 𝑍∞ < 𝑍𝑐
Paso 5: Conclusión:
Se rechaza la hipoteis que el grupo 02 tarde igual o más tiempo que el grupo 01. Por lo tanto el grupo 02 tarda
menos.

CASO II ( SUPONER VARIANZAS DIFERENTES ( 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 ))

Cálculos necesarios:

1. El estadístico de contraste 𝑡𝑐

𝑋̅1 − 𝑋̅2
𝑡𝑐 =
𝑆12 𝑆22

𝑛1 + 𝑛2

2. Calculo de Grados de libertad


2
𝑆 2 𝑆2
( 𝑛1 + 𝑛2 )
1 2 Los grados de libertad SIEMPRE ES UN
𝑔. 𝑙 = 2 2
𝑆12 𝑆22 NUMERO ENTERO MENOR SIN APROXIMAR
( ) ( )
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1

Si el resultado es un número decimal, debe seguir la siguiente regla:


Tomar siempre el NÚMERO ENTERO, sin importar se pueda aproximar al próximo mayor o no. Por ejemplo: :
a) Si el resultado es g.l.= 15.95, se toma 15 grados de libertad y no 16. (No aproximar)
b) Si el resultado es g.l.= 12.75 se tomará 12 g.l.
c) Si el resultado es g.l.=22.35 se toma 22 g.l.

Por ultimo para probar hipotesis, siga los 5 pasos para vistos anteriormente.
Ejemplo 1. Caso 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐

Una empresa comprará una de dos marcas de baterías A o B. Antes de tomar una decisión, las prueba,
a través de algunas muestras y obtiene los siguientes resultados:

Marca A Marca B
𝑛1 = 10 𝑛2 = 12
̅
𝑋1 = 32 ℎ𝑜𝑟𝑎𝑠 ̅
𝑋2 = 26 ℎ𝑜𝑟𝑎𝑠
𝑆1 = 5 ℎ𝑜𝑟𝑎𝑠 𝑆2 = 8 ℎ𝑜𝑟𝑎𝑠

Si no hay razones para suponer que las varianzas poblacionales son iguales y desconocidas.
¿Se podría preferir la marca A? Compruébalo para ∞ = 0.05

Paso 1. Planteamiento de hipótesis:


𝐻𝑜 : 𝜇𝐴 ≤ 𝜇𝐵
𝐻1 : 𝜇𝐴 > 𝜇𝐵
Paso 2: Calcular estadístico de contraste:

𝑋̅1 − 𝑋̅2
𝑡𝑐 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
32 − 26
𝑡𝑐 = = 2.144
2 2
√5 + 8
10 12
Paso 3: Zona de aceptación / rechazo.
Grados de libertad.
2𝑆 2 2
𝑆
( 1 + 2)
𝑛1 𝑛2
𝑔. 𝑙 = 2 2 2
𝑆 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

2
52 82 25 64 2
( + ) (10 + 12)
10 12
𝑔. 𝑙 = 2 2 = = 18.70 = 18
52 82 25 2 64 2
( ) ( ) (10) (12)
10 12 +
+ 9 11
10 − 1 12 − 1

Grados de libertad = 18, y si el nivel de significancia es 0.05 encontremos zona de aceptación y de rechazo.
Zona de aceptación y de rechazo.

𝑔. 𝑙. = 18, ∞ = 0.05

Paso 4. Criterio de decisión:


𝑡𝑐 = 2.144
Valor frontera 𝑡∞ = + 1.734
2

Decisión: Rechazar Ho, ya que 𝑍∞ < 𝑍𝑐


Paso 5: Conclusión:
Se rechaza que la marca B tenga vida mayor o igual a la marca A , por lo que la marca A tiene mayor vida
media que la marca B.

Ejemplo 2. Caso 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐


El departamento de zoología de una ciudad llevó a cabo un estudio para determinar si existe una diferencia
significativa en la densidad de dos organismos en dos estaciones diferentes ubicadas en 2 ríos ubicados a
distancias lejanas. Los siguientes datos proporciona las medidas de densidad el número de organismos por
metro cuadrado en las dos estaciones colectoras

Estación 1 Estación 2
5,030 860 4,980 17,660 2,800 7,030 3,320
13,700 2,200 11,910 22,800 4,670 7,330 1,230
10,730 4,250 8,130 1,130 6,890 2,810 2,130
11,400 15,040 26,850 1,690 7,720 1,330 2,190

Utilice un nivel de significancia del 5 por ciento.


¿Podemos concluir que la densidad de promedio en las dos estaciones son iguales?
Suponga que las observaciones provienen de poblaciones normales con varianzas diferentes

Al calcular media y desviación típica de la muestra obtenemos:

Estación I Estación II
𝑛1 = 16 𝑛2 = 12
𝑋̅1 = 9,897.5 𝑋̅2 = 4,120.83
𝑆1 = 7,874.33 𝑆2 = 2,479.50

Paso 1. Planteamiento de hipótesis:


𝐻𝑜 : 𝜇𝐼 = 𝜇𝐼𝐼
𝐻1 : 𝜇𝐼 ≠ 𝜇𝐼𝐼
Paso 2: Calcular estadístico de contraste:

𝑋̅1 − 𝑋̅2
𝑡𝑐 =
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
9,897.5 − 4,120.83
𝑡𝑐 = = 2.7577
2 2
√7874.33 + 2,479.50
16 12

Paso 3: Zona de aceptación / rechazo.


Grados de libertad.
2
𝑆1 2 𝑆2
2
( + )
𝑛1 𝑛2
𝑔. 𝑙 = 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 −1 𝑛2 −1

2
7874.332 2479.52
( + ) 1.92514 𝑥 103
16 12
𝑔. 𝑙 = 2 2 = = 18.78 = 18
7874.332 2479.52 1.02506 𝑥 1012
( ) ( )
16 12
+ 12 − 1
16 − 1

Grados de libertad = 18, y si el nivel de significancia es 0.05 encontremos zona de aceptación y de rechazo.
Zona de aceptación y de rechazo.
𝑔. 𝑙. = 18, ∞ = 0.05

Paso 4. Criterio de decisión:


𝑡𝑐 = 2.7577
Valor frontera 𝑡∞ = ±2.101
2

Decisión: Rechazar Ho, ya que 𝑍∞ < 𝑍𝑐


Paso 5: Conclusión:
Se rechaza que la densidad de promedio en las dos estaciones son iguales a un nivel del 5%
EJERCICIOS.

1. Los siguientes datos representan los tiempos de duración de películas producidas por dos empresas
cinematográficas

Empresa I (min) 102 86 98 109 92


Empresa II(min) 81 165 97 134 92 87 114

Utilice un nivel de significancia del diez por ciento para probar la hipótesis que las películas
producidas por la empresa II tiene mayor duración el tiempo.
Suponga que las distribuciones de duración son aproximadamente normales con varianzas iguales y
desconocido
R/ No rechazar Ho., No hay evidencia que las películas producidas por la empresa 2 duren más.

2. Cinco muestras de una sustancia ferrosa se usaron para determinar si existe una diferencia entre un análisis
químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. A continuación
se presentan los datos codificados que muestran los análisis de contenido de hierro

Análisis Muestras
1 2 3 4 5
Rayos X 2.0 2.0 2.3 2.1 2.4
Químico 2.2 1.9 2.5 2.3 2.4

Suponga que las poblaciones son normales y pruebe al nivel de significancia del 5% , si los dos
métodos de análisis dan el mismo resultado, Suponga varianzas poblacionales desconocidas pero se
sabe que son diferentes.

R/Aceptar Ho, son iguales.

3. Para indagar si un nuevo suero frena el desarrollo de la leucemia se seleccionaron 9 ratones todos en una
etapa avanzada de la enfermedad . 5 ratones reciben el tratamiento y 4 no . los tiempos de supervivencia ,
en años , a partir del momento en que se comienza el experimento son los siguientes:

Con tratamiento 2.1 5.3 1.4 4.6 0.9


Sin tratamiento 1.9 0.5 2.8 3.1

A un nivel de significancia del 10 por ciento se puede decir que el suero es eficaz ¿suponga que las dos
poblaciones se distribuyen de forma normal con varianzas iguales?
R/ t= 0.70, no hay evidencia que el suero sea efectivo.

También podría gustarte