Analisis de La Varianza Anova
Analisis de La Varianza Anova
Analisis de La Varianza Anova
Distribucion F
Sirve como la distribucion del estadistico de prueba en varias situaciones, con ella se pone a prueba si dos muest
provienen de poblaciones que tienen varianzas iguales, y tambien se aplica cuando se desea comparar varias
medias poblacionales en forma simultanea (ANOVA)
Caracteristicas de la distribucion F
2. La distibucion F es continua
Esto significa que supone un numero infinito de valores entre cero y el infinito positivo
5. Es asintótica
Cuando los valores de X aumentan, La curva F se aproxima al eje X pero nunca lo toca.
Utilizamos la distribucion F cuando se pone a prueba la hipotesis de que la varianza de una poblacion normal es igual a la varia
La distribucion F tambien sirve para probar suposiciones de algunas pruebas estadisticas. Esta dsitribucion proporciona un me
las varianzas de dos poblaciones normales.
Sin importar si se desea determinar si una poblacion varia mas que otra, o validar una suposicion de una prueba estadistica, pr
𝜎_1^2
La cual es que la varianza de una poblacion normal, , es igual a la varianza de otra poblacion normal, . La hipotesis a
varianzas difieren.
𝐻_0;𝜎_1^2=𝜎_2^2
𝐻_1;𝜎_1^2≠𝜎_2^2
Los terminos𝑠_1^2𝑠_2^2
y son las varianzaas muestrales respectivas.
Si la Ho es verdadera, el estadistico de prueba sigue la distribucion F con 𝑛_1−1y 𝑛_2−1 grados de libertad.
Para reducir el tamaño de la tabla de valores criticos, la varianza mas grande la muestra se coloca en el numerador, de aquí, la
asi, el valor critico de la cola de la derecha es el unico que se requiere.
El valor critico de F de una prueba de dos colas se dtermina dividiendo el nivel de significancia entre dos ( ) y despues se
EJERCICIO
𝜒 ̅_2 59
𝑠_2= 4.375
se decide realizar una prueba estadistica para determinar si en realidad existe una diferencia entre las variacione
1. Establecimiento de la Ho y la H1
𝐻_0;𝜎_1^2=𝜎_2^2
𝐻_1;𝜎_1^2≠𝜎_2^2
3. Estadistico de prueb: F
regla de decision…...
que si el valor de prueba F es mayor que el valor critico, 3,86, se rechaza Ho.
Conclusion:
Rechazamos la Ho porque el valor F (4,23) es mayor que el punto critico (3,86)
Concluimos que hay diferencia entre las variaciones de los tiempos en las dos rutas.
na forma de porbar este supuesto estadisticamente es la distribucion F
grados de libertad.
coloca en el numerador, de aquí, la razon F que se indica en la tabla siempre es mayor que 1,00;
ncia entre dos ( 𝛼∕2 ) y despues se consultan los grados de libertad apropiados en la tabla correspondiente.
Según estos resultados hay mas variacion en la carretera 25
F
ANOVA: análisis de la varianza
ANOVA ( analysis of variance )
El ANOVA permite comparar las medias poblacionales de forma simultanea con el nivel de significancia determin
Se estima la varianza de la poblacion de dos formas para despues determinar la razon de dichas estimaciones. Si
y se concluye que las medias poblacionales no lo son. La distribucion F sirve como un arbitro para indicar en que
ocurrido por casualidad.
VARIACION TOTAL
Suma de las diferencias entre cada observacion y la media global elevadas al cuadrado
VARIACION DE TRATAMIENTO
Suma de las diferencias entre la media de cada tratamiento y la media total o global elevadas al cua
VARIACION ALEATORIA
Suma de las diferencias entre cada observacion y su media de tratamiento elevadas al cuadrado
El estadistico de prueba, que es la razon de las dos estimaciones de la variacion poblacional, se determina a parti
azon de dichas estimaciones. Si esta razon es aproximadamente 1 entonces, por logica las dos estimaciones son iguales,
un arbitro para indicar en que instancia la razon de las varianzas muestrales es mucho mayor que 1 para haber
vadas al cuadrado
𝐻_0;𝜇_𝑁=𝜇_𝑤=𝜇_𝑝=𝜇_𝐵
La Hipotesis Alternativa tambien se considera como: "al menos dos calificaciones medias no
Si no se rechaza la hipotesis nula, se concluye que no hay una diferencia entre las calificaciones medias de las cuatro
al menos un par de calificaciones medias, pero en este punto no se sabe cual par o cuantos pares difieren.
Para esto debemos conocer los grados de libertad del numerador y denominador
Los grados de libertad del numerador son iguales al numero de tratam
Los grados de libertad del denominador son el numero total de obse
⇒ Buscamos en la tabla F con nivel de significancia 0,01 …. En la fila superior ubicamos en 3 gra
en la primera columna ubicamos en 18 grados de libertad para el den
⇒ La regla de decision es rechazar Ho si el valor calculado de F es mayor
tabla ANOVA
Fuente de variacion Suma de cuadrados gl
Tratamientos SST k-1
Error SSE n-k
total SS total n-1
SST total = ∑128▒(𝑥−𝑥 ̅_𝐺 )^2 SST total : suma de las diferencias elevada
x es cada observacion de la muestra
𝑥 ̅_𝐺es la media global o total
Se determina SST (la suma de los cuadrados debida a los tratamientos) con la resta:
tabla ANOVA
Fuente de variacion Suma de cuadrados gl Media cuadrática
Tratamientos SST k-1 SST / (k - 1) = MST
Error SSE n-k SSE / (n - k) = MSE
total SS total n-1
* El valor de F = 8,99 es mayor que el punto critico 5,09, por lo que rechazamos Ho
6. Conclusion o interpretacion de resultados
* No todas las medias poblacionales son iguales
* las calificaciones medias de las cuatro aerolineas no son iguales
RESUMEN
Grupos Cuenta Suma
Northern 4 349
WTA 5 391
Pocono 7 510
Branson 6 414
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Entre grupos 890.683766233766 3
Dentro de los grupos 594.407142857143 18
Total 1485.09090909091 21
es medias son iguales
lificaciones medias de las cuatro aerolineas. Si se rechaza Ho, se concluye que hay una diferencia en
cuantos pares difieren.
ador y denominador
son iguales al numero de tratamientos…. k - 1
or son el numero total de observaciones n menos el numero de tratamientos
A
Media cuadrática F
SST / (k - 1) = MST MST / MSE
SSE / (n - k) = MSE
suma de las diferencias elevadas al cuadrado entre cada observacion y la media global
observacion de la muestra
edia global o total
ma de las diferencias elevadas al cuadrado entre cada observacion y su respectiva media de tratamiento.
media muestral del tratamiento c
os del paso 4
o: SST / gl numerador = MST
l denominador = MSE
r lo que rechazamos Ho
Promedio Varianza
87.25 36.91666667
78.2 58.7
72.8571428571429 30.14285714
69 13.6
⇒ SS total
⇒ SSE
SST
Se rechaza ho si F > 4,26 rechazo Ho si el estadistico de prueba F es mayor que el valor critico
c)
A B C SS total
cerca del cerca de la cerca de otros cerca del cerca de la cerca de otros
pan cerveza limpiadores pan cerveza limpiadores
18 12 26 4 64 36
14 18 28 36 4 64
19 10 30 1 100 100
17 16 32 9 16 144
RESUMEN
Grupos Cuenta Suma Promedio Varianza
pan 4 68 17 4.66666667
cerveza 4 56 14 13.3333333
limpiadores 4 116 29 6.66666667
ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados Grados de libertad
Promedio de los cuadradosF Probabilidad
Entre grupos 504 2 252 30.6486486 9.61319E-05
Dentro de los 74 9 8.22222222
Total 578 11
Conclusion
Se rechaza la Ho, porque el estadistico de prueba F (30,65) es mayor que el valor critico 4,26
Si hay diferencia entre los valores medios de botellas vendidas de acuerdo a su ubicacion
cerca del
pan
e el valor critico
SSE
erca de otros cerca del cerca de la cerca de otros
pan cerveza limpiadores SST
1 4 9
9 16 1 SS total - SSE
4 16 1
0 4 9 578 - 74 =
578 14 40 20 74 504
SS total SSE SST
tabla ANOVA
Suma de gl Media F
Cuadrados Cuadratica
504 2 252 30.65
74 9 8.22
578 11