Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 56

PRUEBAS ESTADISTICAS EN SPSS V.

20
MEDIA POBLACIONAL: DESCONOCIDA Ejemplo Desarrollado No 1: Uno de los dimetros de un cigeal es crtico porque est sometido a
fuerzas de torsin, flexin y traccin, se sabe que la media es y la desviacin estndar es , para verificar que las dimensiones estn en sus tolerancias de aceptacin, el inspector de control de calidad saca una muestra de 50 cigeales para medirlos, y los resultados se aprecian a continuacin:
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Dimensiones 30.00 30.50 29.60 30.03 30.04 30.33 30.45 30.60 30.12 29.45 30.46 29.68 29.00 29.92 29.95 30.01 30.43 29.69 29.94 29.97 29.99 30.04 30.42 29.85 30.79 No 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 S Dimensiones 30.50 29.50 29.76 30.55 29.67 29.68 30.41 30.09 29.96 30.72 29.56 29.86 30.10 30.25 29.99 29.78 30.90 30.41 29.55 30.26 30.23 30.32 29.88 29.73 30.23 30.0630 0.385477441

Solucin Ho: H1 : z

= 1.1556

1.16

a. Mtodo del valor-p


La probabilidad para z 1.1556, buscando en tablas es 0.1230, pero es de 2 colas, es decir tambin necesitamos z -1.16 por eso a esta probabilidad lo multiplicamos por 2. 2(0.1230) = 0.2460, como p > , aceptamos la hiptesis nula, es decir que no hay diferencias con la media.

b. Mtodo del valor crtico


1

El valor = 1.96 y como 1.16 < 1.96, es decir que el z calculado est en la regin de aceptacin, se acepta la hiptesis nula. c. Solucin haciendo uso de SPSS Ejecutamos el SPSS cliqueando en Todos los programas, expandimos la carpeta IBM SPSS Statistics, Cliqueamos sobre IBM SPSS Statistics 19, como se aprecia en la siguiente figura:

En la figura siguiente observamos la interfaz visual de SPSS

Cliqueamos sobre lista de variables para colocar nombre a las variables

Hemos colocado el nombre la variable como X, en Tipo, Anchura y Decimales lo dejamos por defecto Enseguida pasamos a Vista de Datos para ingresar los datos respecticos

Despus nos vamos al men Analizar, Comparar medias, Prueba T para una muestra, como se aprecia en la siguiente figura

Seleccionamos la variable X, clic en la fecha para pasarlo a la seccin Variables para contrastar.

Tambin digitamos el valor de prueba, que es de 30

Al cliquear el botn Opciones, aparece la ventana donde puede digitar el Porcentaje del intervalo de confianza, por ahora djelo por defecto djelo en 95%, clic en Continuar y en Aceptar.

En esta tabla observamos que el Sig.(bilateral) es 0.253 > 0.05, por tanto aceptamos la hiptesis nula. Datos del ejercicio desarrollado No 2 1. De acuerdo con la National Automobile Dealers Association, el precio medio de un automvil usado es $10192. El administrador de una distribuidora de la ciudad de Kansas revis una muestra de 50 automviles usados vendidos en esa distribuidora recientemente, con objeto de determinar si la media poblacional de sus precios difera del precio medio en todo el pas. Los precios de los 50 automviles se encuentran en la tabla siguiente. a. Formule las hiptesis para determinar si existe diferencia en el precio medio de los automviles usados de la distribuidora. b. Cul es el valor-p? c. Con = 0.05, cul es su conclusin? Solucin: Hiptesis Ho: H1 : No Automvil 1 2 3 Precio $ 11154 9570 10235 No Automvil 26 27 28 Precio $ 10400 10622 10907
4

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

9140 9345 9766 10328 9621 10022 10290 10899 10704 10308 10306 9339 10196 9589 7997 9567 10626 10654 7855 10399 9500 9062

29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

10407 8550 8624 10375 11887 10964 9920 10082 9465 10993 9082 8740 10077 9698 12056 10390 9474 10004 7938 8899 8888 10606

Prueba T
Estadsticos para una muestra N Precio del automvil 50 Media 9910,4000 Desviacin tp. 920,00126 Error tp. de la media 130,10783

Prueba para una muestra Valor de prueba = 10192 Diferencia de medias -281,60000 95% Intervalo de confianza para la diferencia Inferior Superior -543,0615 -20,1385

Precio del automvil

t -2,164

gl 49

Sig. (bilateral) ,035

El

de tablas

= 2.0086. El valor calculado es -2.164 cae en la regin de rechazo por que es

menor que -2.0086, por tanto se rechaza la hiptesis nula, es decir que hay suficiente evidencia de que los precios de los autos difieren de la media de 10192. Si observamos el Sig(bilateral) es 0.035 que es menor que 0.05(nivel de significacin) por tanto rechazamos la hiptesis nula Ho. Diferencia de dos medias independientes Ejercicio Desarrollado No 2: Considere un nuevo software que ayuda a los analistas de sistemas a reducir el tiempo requerido para disear, elaborar y poner en marcha un sistema de informacin. Para evaluar las ventajas del nuevo software, se toma una muestra de 24 analistas de sistemas. A cada analista se le da informacin sobre un sistema de informacin hipottico. A 12 de ellos se les pide que elaboren el sistema de informacin usando la tecnologa existente y a los otros 12 analistas se les capacita para usar el nuevo software y se les pide que lo empleen para elaborar el sistema de informacin. En el estudio participan dos poblaciones: una poblacin de analistas de sistema que usan la tecnologa ya existente y una poblacin de analistas de sistemas que usan el nuevo software. En trminos del tiempo necesario para el proyecto del sistema de informacin, las medias poblacionales son las siguientes: = media del tiempo que necesitan para el proyecto los analistas que emplean la tecnologa ya existente. = media del tiempo que necesitan para el proyecto los analistas que emplean el nuevo software. El investigador encargado de la evaluacin del nuevo software espera poder demostrar que con el nuevo software se necesita menos tiempo para el proyecto del sistema de informacin. De manera que el investigador tratar de hallar evidencias que le permitan concluir que es menor que caso en el que la diferencia ser mayor que cero. La hiptesis de investigacin > 0 se establece como la hiptesis alternativa. Por lo que la prueba de hiptesis ser Ho: 0 H1 : 0 Como nivel de significancia se usar = 0.05. Tabla: datos y resumen estadstico del tiempo requerido en el estudio de la prueba de software
Tecnologa existente 300 280 344 385 372 360 288 321 376 290 301 283 Tamao de la muestra Media muestral Desviacin estndar muestral n1 = 12 325 Software nuevo 274 220 308 336 198 300 315 258 318 310 332 263 n2 = 12 286

S1=39,9955

S2=43,9979
7

Suponga que los resultados de los 24 analistas son los que se presentan en la tabla anterior. Con el estadstico de prueba dado en la ecuacin siguiente se tiene, t=
( )

= 2.27

De acuerdo con la ecuacin correspondiente a los grados de libertad son


( ) ( )

gl =
( ) ( )

=
( ) ( )

= 21.8

Al redondear hacia abajo, se usar una distribucin t con 21 grados de libertad. El valor p correspondiente de la distribucin t es:

En una prueba de la cola superior, el valor-p es el rea en la cola superior a la derecha de t = 2.27. De acuerdo con este resultado se ve que el valor-p est entre 0.025 y 0.01(0.0169). Por tanto, el valor-p es menor que = 0.05 y se rechaza H0. Los resultados mustrales permiten al investigador concluir que > 0, o que . La investigacin favorece la conclusin de que con el nuevo software el tiempo requerido es menor. Resultado proporcionado con SPSS Ir a Vista de Variables y crear las variables Tiempo y Tipo

Cliquear en Valores y crear la etiqueta: Valor Etiqueta 1 Tecnologa existente 2 Con software Para cada una de ellas de clic en Aadir

Ingrese los datos respectivos, para los 12 primeros en tipo ingrese 1 y para los 12 restantes digite 2.

Ir Analizar/Comparar medias/Prueba T para muestras independientes

La variable Tiempo, seleccione y pselo al casillero Variables para contrastar, y la variable Tipo al casillero Variable de agrupacin

Cliquee en Definir grupos y en Grupo 1 digite 1 y en Grupo 2, digite 2

La figura siguiente se observa cmo queda definida la variable Tipo

Finalmente haga clic en Aceptar

Observamos que el Sig. (bilateral) es 0.033, pero estamos interesados en la cola superior, entonces este Sig. Lo dividimos entre 2 (0.033/2=0.0165) y este valor es menor que 0.05, por tanto rechazamos la hiptesis nula y aceptamos la alternativa, es decir que si hay diferencias con la media, el nuevo software favorece los tiempos respectivos.

10

Prueba de la cola inferior Hiptesis Ho: H1 : Estadstico de la prueba


(

Prueba de la cola superior Ho: H1 :

Prueba de dos colas

Ho: H1 :
(

t=

t=

t=

Regla de rechazo: Mtodo del valor -p Regla de rechazo: Mtodo del valor critica

Rechazar Ho si valor p Rechazar Ho si t

Rechazar Ho si valor p Rechazar Ho si t

Rechazar Ho si valor p Rechazar Ho si t o si t

Figura que muestra la ubicacin de la regin crtica para estas situaciones Prueba de muestras independientes Ejercicio Desarrollado No 3 Se toma una muestra aleatoria simple de trabajadores y cada uno de ellos usa el mtodo 1. Se toma otra muestra aleatoria simple de trabajadores y cada uno de ellos usa el mtodo 2. El procedimiento que se usa para probar la diferencia entre las dos medias, se ve a continuacin. En este apartado se presentan mtodos de construccin del intervalo de confianza para la diferencia de medias y contrastes de igualdad de las mismas basados en la distribucin t-Student son aplicables en aquellas situaciones en las que se dispone de dos muestras independientes extradas de poblaciones con distribucin normal. Se aplica la prueba t de dos maneras: asumiendo o no que las varianzas de las dos poblaciones son iguales. Con el objeto de elegir cul es la forma de contraste adecuada en cada estudio, tambin se presenta un contraste sobre la igualdad de varianzas basado en la distribucin F. Los tiempos que tardan en realizar una tarea una muestra aleatoria de trabajadores novatos y experimentados, se presentan a continuacin. Se supone que las distribuciones de los tiempos que tardan cada tipo de trabajadores tiene una distribucin aproximadamente normal Trabajadores Novatos Trabajadores experimentados 89 60 87 85 88 16 43 91 16 45 87 65 85 66 87 18 40 49 36 42 88 87 58 85 88 50 16 41 16 43 86 84 83 82 85 50 41 16 43 52 84 88 85 83 70 41 50 14 41 50 84 88 82 85 80 55 44 16 54 42 81,8 39,03 9,363 16,95 n1 = 30 n2 = 30
11

t=

t=

= 12.098

Nos proporcionan los datos suficiente evidencia para concluir que el tiempo promedio de los trabajadores novatos difiere del tiempo promedio de los trabajadores experimentados, al nivel de significacin del 5 %? El Problema de prueba de hiptesis en este caso se formula as: Ho: 1 = 2 ( el tiempo medio que tarda en realizar una tarea un trabajador novato es el mismo que tarda un trabajador experimentado ) H1: 1 2 ( el tiempo medio que tarda en realizar una tarea un trabajador novato no es el mismo que tarda un trabajador experimentado ) Con = 5 % to =

= 12.098

El t de tablas es = 2.045 Como to > t de tablas (12.098>2.045) (El punto crtico queda en la regin de rechazo) por tanto rechazamos la hiptesis nula y aceptamos la alternativa: el tiempo medio que tarda en realizar una tarea un trabajador novato no es el mismo que tarda un trabajador experimentado Solucin usando software SPSS V 20 1) Ingrese en Vista de variables: Tiempo con 2 dgitos 0 decimales 6 columnas, TipoTrabajador con 1 dgito 0 decimales 5 columnas en Valores para esta variable: digite 1 Novato, clic en aadir 2 Experimentado, y clic en aadir

12

2) Ingrese los datos en vista de datos. En Tiempo los datos del tiempo que tardan los 30 trabajadores novatos, seguido de los datos de tiempo de los 30 trabajadores experimentados (en total, en este caso 60 datos). En TipoTrabajador escriba 1 para los datos de los trabajadores novatos y 2 para los datos de los trabajadores experimentados. 3) En analizar/ Comparar medias: elija la opcin Prueba t para dos muestras independientes

4) Seleccione e ingrese la variable Tiempo en variable de prueba y TipoTrabajador en variable de agrupamiento

13

5) Visualice los resultados 6) Interprtelos

Como Sig(bilateral es 0.000 es menor que 0.05, rechazamos Ho, es decir hay evidencias de que los tiempos de los trabajadores novatos es diferentes que el de los experimentados. Tambin se observa el = 2.045 y el t calculado es 12.313 este es mayor que el t de tablas (2.045) por tanto queda en la regin critica. Prueba de una muestra conociendo su Ejercicio Desarrollado No 4: Los tiempos de diligenciado del formulario nico de atencin a usuarios del SATT, de una muestra de usuarios que fueron atendidos el ltimo mes en la oficina central del SATT, se muestra a continuacin. Asumiendo que dicha variable tiene un comportamiento aproximadamente normal, permitiran los datos confirmar la hiptesis del encargado de que el tiempo promedio de diligenciado de dicho formato es 35 minutos, a un nivel de significacin del 5% ? 16 18 50 50 41 55 43 40 16 41 50 44 91 49 41 16 14 16 16 36 16 43 41 54 45 42 43 52 50 42 39,0333 16,9492
14

Promedio( ) = Desviacin estndar S

El Problema de prueba de hiptesis en este caso se formula as: Ho: = 35 H1: 35 Con = 5 %

t0 =

= 1.3033

Como 2.0452 < t0 < 2.0452 Como -2.0452 < 1.3033 < 2.0452 El t0 est dentro de la regin de aceptacin, entonces aceptamos la Hiptesis Nula H 0, es decir que los datos de la muestra tienen un promedio igual que la poblacin con un nivel de confianza del 95% Solucin usando software SPSS V 20 1) Ingrese en Vista de variables: tiempo con 2 dgitos 0 decimales 2) Ingrese los datos en vista de datos (30 datos) 3) En analizar/ Comparar medias: elija la opcin Prueba t para una muestra 4) Seleccione e ingrese la variable tiempo en la ventana derecha, escriba el valor de prueba en la parte inferior de la ventana, en este caso 35 5) Visualice los resultados 6) Interprtelos

Por otro lado observamos que el valor de Sig.(bilateral)(0.203) es mayor que el nivel de significancia , por tanto aceptamos la hiptesis nula. Ejercicio Desarrollado No 5: Una determinada muestra del plasma de un adulto se sabe que contiene 2,6 mg/l de hierro. Un aparato automtico de medida realiza 20 determinaciones de la concentracin de hierro, obteniendo los valores 2,6 2,4 2,7 3,2 3,4 3,5 3,2 3,6 3,4 3,5 2,8 2,6 2,9 3,1 3,3
15

3,5

3,2

3,6 3,3 3,5 Promedio 3,165 Desviacin Estndar S 0,37173137

Puede considerarse que el aparato mide en promedio lo que realmente hay, con una confianza del 95%? Solucin: El problema de prueba de hiptesis se formula as Ho: = 2.6 H1: 2.6 Con = 5 % t0 =

= 6.625

Utilizar el software SPSS V. 20 para contrastar la hiptesis.

Como t0 > (6.625 > 2.0452), queda en la regin de rechazo o como el valor sig (bilateral) es 0.000 < 0,01, entonces decimos que los datos nos proporcionan suficiente evidencia para concluir que el nivel medio de hierro en la muestra de plasma de un adulto es significativamente diferente del valor de Prueba de 2.6, por lo que podemos concluir que el aparato no est midiendo en promedio lo que realmente hay, es decir no est controlado.

Pruebas de muestras pareadas o dependientes


Ejercicio Desarrollado No 6: Prueba t para la diferencia de las medias de dos poblaciones pareadas. En este caso se usa las dos muestras correspondientes al grupo que recibi calcio al principio del experimento y se compara con el mismo grupo luego del experimento. Las dos muestras no son independientes. Se compara la media de las diferencias pareadas de la presin sangunea de cada miembro del grupo antes y despus de recibir el calcio: Prueba t para la media de las diferencias de la presin sangunea de los individuos en el grupo de calcio La hiptesis H0 : = 0 versus Ha : 0

Calcio (107, 110, 123, 129, 112, 111, 107, 112, 136, 102) pos calcio (106, 113, 118, 117, 107, 93, 108, 100, 131, 84) Post calcio Y (d - )2

Calcio X

d=X-Y

16

107 110 123 129 112 111 107 112 136 102

106 113 118 117 107 93 108 100 131 84 Suma S=

1 -3 5 12 5 18 -1 12 5 18 72 7,2 7,48034461

38,44 104,04 4,84 23,04 4,84 116,64 67,24 23,04 4,84 116,64 503,6

tp =

= 3.0438

El t de tablas con 9 grados de libertad = = 2.262 Como el estadstico tp > es decir que cae en la regin de rechazo, se rechaza la hiptesis nula. Hay diferencia significativa en la presin sangunea antes y despus de administrar el calcio Solucin con SPSS V 20

17

Como Sig(bilateral) es 0.014 y este valor es menor que 0.05 se rechaza la hiptesis nula Ho. Hay diferencia significativa en la presin sangunea antes y despus de administrar el calcio Ejercicio Desarrollado No 7: Una compaa de taxis trata de decidir si compra neumticos de la marca A o de la marca B. Con tal fin se asigna al azar un neumtico de cada compaa a las ruedas traseras de 16 taxis y se registran las siguientes distancias en kilmetros recorridos. Asumiendo que las diferencias de las distancias se distribuyen en forma aproximadamente normal, pruebe la hiptesis involucrada al nivel de significacin del 5% Los datos son los siguientes:
Taxi 1 2 3 4 5 6 7 8 9 Marca A 34400 45500 36700 32000 48400 32800 38100 30100 34300 Marca B 36700 46800 37700 31100 47800 36400 38900 31500 37300 D -2300 -1300 -1000 900 600 -3600 -800 -1400 -3000
18

10 11 12 13 14 15 16

43500 37200 31400 45600 34300 37400 31100

46700 38500 32400 45200 36500 38600 31400 Suma S=

-3200 -1300 -1000 400 -2200 -1200 -300 -20700 -1293,75 1326,383

En este caso la prueba de hiptesis involucrada se formula as: Ho: 1 - 2 = d = 0 ( La media de las diferencias de la marca A menos la marca B es igu al a 0, lo que implica las dos marcas de llantas tienen en promedio la misma distancia recorrida) H1: 1 2 = d 0 (La media de las diferencias de la marca A menos la marca B no es igual a 0, lo que implica las dos marcas de llantas tienen en promedio la misma distancia recorrida) estadstica de prueba: tp =

= -3.9016

El t de tablas

= 1.753

El tp calculado es < que el t de tablas es decir cae en la regin de rechazo, por tanto se rechaza la hiptesis nula, es decir es diferente que compre neumticos de la marca A o B, porque tienen diferentes recorridos. Para un nivel de significacin dado, ejecutaremos la prueba utilizando el software SPSS V. 20, de la siguiente manera: 1) Defina las variables en Vista de variables i) MarcaA con 5 dgitos 0 decimales y ii) MarcaB con 5 dgitos 0 decimales 2) Ingrese los datos de MarcaA y de MarcaB, en vista de datos 3) Ejecute la prueba de hiptesis en Analizar/ Comparar medias/ Opcin Prueba t para muestras pareadas 4) Visualice los resultados 5) Intrprete los resultados hallados

19

Estadsticos de muestras relacionadas 20

Media Par 1 Neumticos Marca A Neumticos Marca B 37050,0000 38343,75

N 16 16

Desviacin tp. 5759,86111 5611,888

Error tp. de la media 1439,96528 1402,972

Par 1

Correlaciones de muestras relacionadas N Correlacin Neumticos Marca A y 16 ,973 Neumticos Marca B

Sig. ,000

De acuerdo al Sig(bilateral) es 0.001, este valor es menor que el de significancia (0.05) por tanto rechazamos Ho, por tanto hay suficiente evidencia para determinar que hay diferencia entre el recorrido de las dos marcas de llantas. Ejercicio Desarrollado No 8: Se desea saber si un taller es efectivo para cambiar el nivel de autoestima de un grupo de pacientes, para ello se evala la autoestima antes de iniciar el taller y al finalizar el mismo. Los datos obtenidos se muestran a continuacin, donde X son los puntajes de la primera medicin y Y corresponde a la segunda medicin, D son las diferencias entre los puntajes de las 2 mediciones:
X 18 16 18 12 20 17 18 20 22 20 10 8 20 12 16 16 18 Y 20 22 24 10 25 19 20 21 23 20 10 12 22 14 12 20 22 d=X-Y -2 -6 -6 2 -5 -2 -2 -1 -1 0 0 -4 -2 -2 4 -4 -4
21

20 18 21 17

24 23 17 19 S

-4 -5 4 - 40 -2 2.937955

Procedimiento: 1. Para cada problema especfico se debe determinar el tipo de problema, los grupos a comparar, si son independientes o relacionados, el nivel de medicin, la prueba estadstica que debe utilizarse y plantear la hiptesis nula que se debe probar de acuerdo al nivel de medicin y tipo de problema correspondiente. Es un problema de Comparacin de 2 grupos relacionados Nivel de medicin intervalar H0: 1 - 2 = d = 0 El nivel de autoestima es igual entre la medicin de inicio y la medicin hecha al finalizar el taller H1: : 1 - 2 = d 0 El nivel de autoestima es mayor entre la medicin de inicio y la medicin hecha al finalizar el taller Prueba estadstica: Prueba t para grupos relacionados Obtener las diferencias (D) entre los puntajes obtenidos en la primera medicin y la segunda medicin (datos de la columna X menos los datos de la columna Y). En Excel se calculan estas diferencias, as como se calcula la S (desviacin estndar) Calcular el valor t mediante la frmula:

t=

= -3.044

9. Buscar el valor de t en tabla con el nivel de significancia de 0.05 y con 19 grados de libertad. El valor de
t obtenido de las operaciones debe compararse con ese valor de tabla es 20.93. La regla de decisin es: si el valor calculado es mayor o igual que el valor en tabla se debe rechazar la H0. Para este ejercicio, con 19 grados de libertad, al nivel de significancia establecido en el valor de 0.05, se tiene un valor en tabla de 2.093, el valor de t calculado es mayor al de tabla (el signo no debe ser tomado en cuenta) por lo tanto se rechaza H0, entonces: el nivel de autoestima es diferente entre la primera y segunda mediciones.

Solucin Con SPSS


Estadsticos de muestras relacionadas Media N Desviacin tp. Par 1 Antes de Taller Despus de Taller 17,0000 19,0000 20 20 3,79751 4,82319

Error tp. de la media ,84915 1,07850

Par 1

Correlaciones de muestras relacionadas N Correlacin Antes de Taller y Despus 20 ,793 de Taller

Sig. ,000 22

Como el Sig.(bilateral) es 0.007, y este valor es menor que el valor de significancia(0.05), rechazamos la hiptesis nula Ho, es decir que si hay evidencias de que el nivel de autoestima ha mejorado Procedimiento ANOVA ANOVA es el acrnimo de Anlisis de la Varianza. Es una prueba estadstica desarrollada para realizar simultneamente la comparacin de las medias de ms de dos poblaciones. A la asuncin de Normalidad debe aadirse la de la homogeneidad de las varianzas de las poblaciones a comparar. Esta condicin previa de aplicacin se verificar estadsticamente mediante una de las opciones que se encuentran dentro de la configuracin del ANOVA. La configuracin del anlisis se realiza en el cuadro de dilogo correspondiente. En este cuadro se debe introducir la variable a analizar ( variable dependiente) as como la variable que define los grupos a comparar (factor). Si el ANOVA resultase en el rechazo de la hiptesis nula de igualdad de medias, se debe proseguir al anlisis con la realizacin de los contrastes a posteriori (Post hoc...). Finalmente, la aludida prueba de homogeneidad de varianzas se solicita en las Opciones... del anlisis. En el apndice de resultados se muestran los resultados relativos a un anlisis de la Varianza de la variable presin arterial media final del ejemplo 1, analizada segn los grupos de tratamiento. Ejercicio Desarrollado No 9

Anlisis de Varianza con medidas repetidas: El procedimiento MLG: Medidas Repetidas


Los modelos de anlisis de varianza (ANOVA) con medidas repetidas (MR) sirven para estudiar el efecto de uno o ms factores cuando al menos uno de ellos es un factor intra-sujetos. En los factores inter-sujetos o completamente aleatorizados. A cada nivel del factor se le asigna o le corresponde un grupo diferente de sujetos. Por el contrario, un factor intra-sujetos o con medidas repetidas se caracteriza porque todos los niveles del factor se aplican a los mismos los sujetos. El diseo ms simple de medidas repetidas consiste en medir dos variables en una misma muestra de sujetos. Los datos de este diseo se analizan con la prueba T para muestras relacionadas ya estudiada anteriormente. Pero los diseos de medidas repetidas pueden tener ms de dos medidas y ms de un factor. Imaginemos una investigacin diseada para conocer la opinin de los consumidores sobre cinco productos alternativos o rivales. Podemos optar por seleccionar tantos grupos de sujetos como productos disponibles (cinco) y hacer que cada grupo opine sobre un solo producto. De esta manera, tendremos un diseo con un factor (tipo de producto, con cinco niveles) y tantos grupos de sujetos como niveles tiene el factor (cinco). Para analizar los datos de este diseo podemos utilizar un ANOVA de un factor completamente aleatorizado. En lugar de esto, podemos seleccionar un nico grupo de sujetos y pedirles que expresen su preferencia por cada uno de los cinco productos rivales. En ese caso, seguiremos teniendo un diseo de un factor (el tipo de producto, con cinco niveles), pero un slo grupo de sujetos que hacemos pasar por las cinco condiciones definidas por los niveles del factor (tendremos a todos los sujetos opinando sobre todos los productos). Para analizar los datos de este diseo podemos utilizar un ANOVA de un factor con medidas repetidas.

23

Las ventajas de los diseos de medidas repetidas son evidentes: requieren menos sujetos que un diseo completamente aleatorizado y permiten eliminar la variacin residual debida a las diferencias entre los sujetos (pues se utilizan los mismos). Como contrapartida, es necesario vigilar algunos efectos atribuibles precisamente a la utilizacin de los mismos sujetos, tales como el efecto de arrastre que o cune cuando se administra una condicin antes de que haya finalizado el efecto de otra administrada previamente: o el efecto del aprendizaje por la prctica que ocurre cuando las respuestas de los sujetos pueden mejorar con la repeticin y. como consecuencia de ello, los tratamientos administrados en ltimo lugar parecen ms efectivos que los administrados en primer lugar, sin que haya diferencias reales entre ellos (en estos casos es importante controlar el orden de presentacin de las condiciones). Obviamente, conviene conocer las ventajas e inconvenientes de estos diseos para decidir correctamente cundo es apropiado utilizarlos. La opcin Medidas repetidas del procedimiento Modelo lineal general permite ajustar modelos de ANOVA unifactoriales y factoriales con medidas repetidas en todos los factores o slo en algunos. Tambin permite ajustar modelos ele anlisis de covarianza.

Modelo de un factor
Vamos a comenzar el estudio del ANOVA de medidas repetidas con el caso ms simple de todos: el modelo de un factor. Los datos que permite analizar este modelo son los procedentes de un diseo con un solo grupo de sujetos y un nico factor cuyos niveles se aplican a todos los sujetos. Las distintas medidas, tantas como niveles tiene el factor, se toman sobre los mismos sujetos. De ah el nombre de medidas repetidas que reciben estos modelos.

Datos

Sujetos 1 2 3 4 5 6 7 8 9

hora 16 12 12 15 18 13 18 15 20

da 8 9 10 13 12 13 16 9 9

semana 8 9 10 7 12 8 10 6 11

mes 12 10 8 11 12 10 13 6 8

24

Anlisis bsico
Para llevar a cabo un ANOVA de un factor con medidas repetidas:

Seleccionar la opcin Modelo lineal general / Medidas repetidas del men Analizar para acceder al cuadro de dilogo Definir factor (es) de medidas repetidas que muestra la figura siguiente.

Figura 16.1. Cuadro de dilogo Definicin de factor(es) de medidas repetidas. Este primer cuadro de dilogo permite empezar a definir el factor (o factores) MR asignndole un nombre y especificando el nmero de niveles de que consta: Nombre del factor intra-sujetos. El primer paso para definir un factor MR o intrasujetos consiste en asignarle un nombre. Puesto que un factor MR se corresponde con ms de una variable del archivo de datos, es un factor que todava no existe en ninguna parte. Debemos comenzar a crearlo asignndole un nombre en este cuadro de texto. El nombre no se debe duplicar el nombre de una variable ya existente en
25

el archivo de datos. Puede elegirse cualquier nombre, pero conviene utilizar un nombre que tenga sentido para el usuario y que tenga relacin con el significado del factor. En el ejemplo del cuadro de dialogo de la figura anterior hemos elegido el nombre tiempo para referirnos al factor definido por las variables hora, da, semana y mes. Nmero de niveles. Este cuadro de texto permite introducir el nmero de niveles (=variables) de que consta el factor recin nombrado. Tras asignar nombre y nmero de niveles al factor MR: Pulsar el botn Aadir para trasladar a la lista central y hacer efectivos tanto el nombre del factor como el nmero de niveles. La lista mostrar entonces el nombre asignado y. entre parntesis, el nmero de niveles. Utilizar los botones Cambiar y Borrar para modificar o eliminar, respectivamente, factores previamente aadidos. Medida. Este botn expande el cuadro de dilogo Definicin de factor(es) de medidas repetidas (ver figura anterior) para permitir definir ms de una variable dependiente. El significado y la utilidad de este botn se tratan ms adelante, en este mismo captulo, en el apartado Modelo de un factor: Ms de una variable dependiente. Una vez aadidos el nombre y el nmero ele niveles del factor MR: Pulsar el botn Definir... para acceder al cuadro de dilogo Medidas repetidas que muestra la figura siguiente.

Cuadro de dialogo: medidas repetidas

Variables mira-sujetos. Esta lista est preparada para recibir los nombres de las variables que definen el factor intra-sujetos. Puesto que en el cuadro de dilogo previo liemos dicho que nuestro factor MR (al que hemos llamado tiempo) tiene 4 niveles, el SPSS est esperando que le indiquemos cules son las cuatro variables que definen esos niveles. Para ello: Marcar las variables en la lista de variables del archivo de datos y trasladarlas a la lista Variables intra-sujetos utilizando el correspondiente botn flecha. La figura 16.2 (bis) muestra el cuadro de dilogo Medidas repetidas con las variables hora, da, semana y mes ya trasladadas a la lista Variables intra-sujetos para definir los niveles del factor MR.

26

Figura Cuadro de dilogo Medidas repetidas. Utilizar los botones flecha de desplazamiento vertical para modificar, si fuera necesario, el orden de las variables seleccionadas. Factores iuter-sujetos. En el caso de que el diseo incluya uno o ms factores inter-sujetos, trasladarlos a esta lista (ver ms adelante, en este mismo captulo, el apartado Modelo de dos factores: Medidas repetidas en un solo factor). Covariables. En el caso de que el diseo incluya una o ms covariables. estas deben trasladarse a la lista Covariables (ver, en el captulo 15 sobre ANOVA factorial. el apartado Anlisis de covarianza). Ejemplo (MLG > ANOVA de un factor con medidas repetidas) Vamos a continuar con el ejemplo que liemos utilizado para describir el procedimiento. Tenemos un factor MR al que llamamos tiempo. con 4 niveles (hora, da. semana y mes): y utilizamos como variable dependiente la calidad del recuerdo. Queremos estudiar el posible efecto del paso del tiempo sobre la calidad del recuerdo. Los datos se encuentran en la tabla anterior. Seleccionar la opcin Modelo lineal general > Medidas repetidas del men Analizar para acceder al cuadro de dilogo Definir factor (es) de medidas repetidas. Introducir el nombre del factor MR (tiempo) en el cuadro de texto Nombre del factor intra-sujetos y el nmero de niveles de que consta el factor (4) en el cuadro de texto Numero de niveles. Pulsar el botn Aadir. Pulsar el botn Definir para acceder al cuadro de dilogo Medidas repetidas. Seleccionar las variables hora, da. semana y mes y trasladarlas a la lista Variables intra-sujetos. Aceptando estas elecciones, el Visor ofrece varias tablas de resultados basadas en las especificaciones que el programa tiene establecidas por defecto. Modelo lineal general
Factores intra-sujetos Medida: MEASURE_1 Tiempo Variable dependiente 1 Hora 2 Da 3 Semana 4 Mes

27

Efecto Traza de Pillai Lambda de Wilks Tiempo Traza de Hotelling Raz mayor de Roy a. Diseo: Interseccin Diseo intra-sujetos: Tiempo b. Estadstico exacto

Tabla: 16.2: Contrastes multivariados Valor F Gl de la hiptesis Gl del error ,875 14,049b 3,000 6,000 b ,125 14,049 3,000 6,000 7,025 14,049b 3,000 6,000 b 7,025 14,049 3,000 6,000

Sig. ,004 ,004 ,004 ,004

Las tablas 16.2 a la 16.4 ofrecen varios estadsticos para poner a prueba la hiptesis nula referida al efecto del factor Tiempo. La tabla 16.2 contiene cuatro estadsticos multivariados: la traza de Pillai. La lambda de Wilks, la traza de Hotelling y la raz mayor de Roy. Para una descripcin de estos estadsticos puede consultarse Bock (1975) o Tabachnik y Fidel (1983). Se interpretan de la misma manera que el resto de estadsticos ya estudiados: puesto que el nivel crtico (Sig.) asociado a cada uno de ellos (en nuestro ejemplo es el mismo para todos: 0.004) es menor que 0.05, podemos rechazar la hiptesis nula de igualdad de medias y concluir que la calidad del recuerdo no es la misma en los cuatro momentos temporales definidos por el factor tiempo. En los modelos de medidas repetidas es necesario suponer que las varianzas de las diferencias entre cada dos niveles del factor MR son iguales. Con por ejemplo, 4 niveles, tenemos 6 pares de combinaciones dos a dos entre niveles: 1-2, 1-3, 1-4, 2-3, 2-4 y 3-4. Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables. En el modelo de un factor MR suponemos que las varianzas de esas 6 variables son iguales. Este supuesto equivale a afirmar que la matriz de varianzas-covarianzas es circular o esfrica (para una completa aclaracin de este supuesto, ver Kirk, 1982. pgs. 256-261: o Winer. Brown Michels. 1991, pgs. 239-273.). Y el procedimiento Medidas repetidas ofrece (tabla 16.3), para contrastarlo. la prueba de esfericidad de Mauchly (1940). Puesto que el nivel crtico asociado al estadstico W(Sig. = 0.804) es mayor que 0.05. no podemos rechazar la hiptesis de esfericidad.
Tabla 16.3: Prueba de esfericidad de Mauchlya W de Mauchly Chi-cuadrado aprox. gl Sig.

Medida: MEASURE_1 Efecto intra-sujetos

Epsilonb GreenhouseHuynhLmiteGeisser Feldt inferior Tiempo ,707 2,331 5 ,804 ,804 1,000 ,333 Contrasta la hiptesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional a una matriz identidad. a. Diseo: Interseccin Diseo intra-sujetos: Tiempo b. Puede usarse para corregir los grados de libertad en las pruebas de significacin promediadas. Las pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos.

En el caso de que el estadstico W lleve al rechazo de la hiptesis de esfericidad es posible optar por dos soluciones alternativas. Bien podemos basar nuestra decisin en los estadsticos multivariados de la tabla 16.2 (pues no les afecta el incumplimiento del supuesto de esfericidad). Bien podemos utilizar el estadstico F univariado que ofrece la tabla 16.4 aplicando un ndice corrector llamado psilon (Box. 1954). Este ndice corrector (ver tabla 16.3. mitad derecha) expresa el grado en que la matriz de varianzascovarianzas se aleja de la esfericidad: en condiciones de esfericidad perfecta, psilon vale 1. La tabla ofrece dos estimaciones de psilon. Greenhouse-Geisser (1959: Geisser y Greenliouse. 1958) y HuynhFeldt (1976). siendo la primera de ellas algo ms conservadora. Un tercer valor. Lmite inferior expresa el
28

valor que adoptara psilon en el caso de incumplimiento extremo del supuesto de esfericidad. Para poder utilizar el estadstico F univariado (tabla 16.4) en condiciones de no-esfericidad es necesario corregir los grados de libertad de F (tanto los del numerador como los del denominador) multiplicndolos por el valor estimado de psilon.
Medida: MEASURE_1 Origen Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Tabla 16.4 Pruebas de efectos intra-sujetos. Suma de cuadrados tipo III 218,083 218,083 218,083 218,083 100,667 100,667 100,667 100,667 gl 3 2,413 3,000 1,000 24 19,307 24,000 8,000 Media cuadrtica 72,694 90,367 72,694 218,083 4,194 5,214 4,194 12,583 F 17,331 17,331 17,331 17,331 Sig. ,000 ,000 ,000 ,003

Tiempo

Error(Tiempo)

Si no se incumple el supuesto de esfericidad es preferible utilizar la aproximacin univariada (versin esfericidad asumida; ver tabla 16.4), pues, en condiciones de esfericidad, el estadstico univariado F es ms potente que los estadsticos multivariados, sobre todo con muestras pequeas (aunque, por supuesto, si ambas aproximaciones conducen a la misma decisin es irrelevante utilizar una u otra). Observando los resultados de la tabla 16.4 vemos que las cuatro versiones del estadstico F (la no corregida y las tres corregidas) conducen a la misma conclusin, que a su vez coincide con la ya alcanzada utilizando la aproximacin multivariada: puesto que el nivel crtico (Sig.) es menor que 0,05, podemos rechazar la hiptesis de igualdad de medias y concluir que la calidad del recuerdo no es la misma en las cuatro medidas obtenidas ponente cuadrtico). Conviene sealar que. cuando existe ms de un componente significativo, suele interpretarse el de mayor orden: sin embargo, esto depende generalmente de las hiptesis previas que tenga establecidas el investigador. Por otra parte, un grfico de perfil (ver siguiente apartado) puede ayudamos a comprender con ms claridad lo que est ocurriendo. La ltima tabla de resultados (tabla 16.6.) ofrece el contraste de los efectos inter-sujetos. En un diseo de un solo factor mtra-sujetos el nico efecto inter-sujetos es el que se refiere a la media global. El estadstico i7 de la tabla 16.6 permite contrastar la hiptesis de que el promedio poblacional global vale cero. Puesto que el nivel crtico (Sig. = 0.000) es menor que 0.05, podemos rechazar esa hiptesis y concluir que la media total es significativamente distinta de cero. Generalmente, este contraste carece de sentido.

Medida: MEASURE_1 Origen Tiempo Lineal Cuadrtico Cbico Lineal Cuadrtico Cbico

Tabla 16.5 Pruebas de contrastes intra-sujetos Suma de cuadrados tipo III 151,250 66,694 ,139 32,000 23,556 45,111 gl 1 1 1 8 8 8 Media cuadrtica 151,250 66,694 ,139 4,000 2,944 5,639 F 37,813 22,651 ,025 Sig. ,000 ,001 ,879

Tiempo

Error(Tiempo)

29

Aspectos complementarios de anlisis Contrastes


El procedimiento Medidas repetidas asigna, por defecto, contrastes de tipo Polinmico a los factores MR (ver, en el captulo 15 sobre ANOVA factorial, el apartado Contrastes personalizados). Estos contrastes polinmicos, que permiten estudiar el tipo de relacin existente entre el factor y la variable dependiente (lineal, cuadrtica, cbica, etc.), podran no tener sentido dependiendo del factor MR que estemos utilizando. Si fuera ese el caso, puede optarse por asignar como contraste para el factor MR la opcin Ninguno o cualquier otra de las disponibles (si tuviera sentido), o puede, simplemente, ignorarse la informacin de la tabla de resultados correspondiente a los contrastes polinmicos. Si no se modifica la opcin por defecto del botn Contrastes..., el Visor ofrece los contrastes polinmicos que muestra la tabla 16.5. Puesto que se trata de contrastes ortogonales, la tabla muestra tantos contrastes como niveles tiene el factor, menos uno: como nuestro factor tiempo tiene cuatro niveles, aparecen tres contrastes: lineal, cuadrtico y cbico. La tabla recoge, para cada contraste, la informacin necesaria para contrastar la hiptesis nula de que el polinomio o componente evaluado vale cero en la poblacin. Basndonos en los niveles crticos ( Sig.) asociados a cada estadstico F podemos rechazar las hiptesis nulas referidas a los componentes lineal y cuadrtico, pero no la referida al componente cbico. Podemos concluir, por tanto, que las medias de la calidad del recuerdo en cada momento temporal se ajustan significativamente tanto a una lnea recta (componente lineal) como a una curva (componente cuadrtico). Conviene sealar que, cuando existe ms de un componente significativo, suele interpretarse el de mayor orden: sin embargo, esto depende generalmente de las hiptesis previas que tenga establecidas el investigador. Por otra parte, un grfico de perfil (ver siguiente apartado) puede ayudamos a comprender con ms claridad lo que est ocurriendo.
Tabla 16.6: Pruebas de los efectos inter-sujetos Medida: MEASURE_1 Variable transformada: Promedio Origen Suma de gl Media cuadrtica F cuadrados tipo III Interseccin 4646,694 1 4646,694 406,022 Error 91,556 8 11,444

Sig. ,000

La ltima tabla de resultados (tabla 16.6.) ofrece el contraste de los efectos inter-sujetos. En un diseo de un solo factor intra-sujetos el nico efecto inter-sujetos es el que se refiere a la media global. El estadstico i7 de la tabla 16.6 permite contrastar la hiptesis de que el promedio poblacional global vale cero. Puesto que el nivel crtico (Sig. = 0.000) es menor que 0.05, podemos rechazar esa hiptesis y concluir que la media total es significativamente distinta de cero. Generalmente, este contraste carece de sentido.

30

Grficos de perfil

Grfico de perfil representando el efecto del factor tiempo

Opciones

31

Medias marginales estimadas Tiempo

32

Medida:MEASURE_1 Tiempo 1 2 3 4 Media 15,444 11,000 9,000 10,000

Tabla 16.7: Estimaciones Intervalo de confianza 95% Lmite inferior Lmite superior 13,267 17,622 8,966 13,034 7,511 10,489 8,239 11,761

Error tp. ,944 ,882 ,645 ,764

Medida:MEASURE_1

Tabla 16.8: Comparaciones por pares Intervalo de confianza al 95 % para la diferenciaa Lmite inferior Lmite superior ,340 8,549 3,425 9,463 1,772 9,117 -8,549 -,340 -1,527 5,527 -1,720 3,720 -9,463 -3,425 -5,527 1,527 -3,899 1,899 -9,117 -1,772 -3,720 1,720 -1,899 3,899

Diferencia de (J)Tiempo medias (I-J) Error tp. * 2 4,444 1,180 3 6,444* ,868 * 4 5,444 1,056 2 1 -4,444* 1,180 3 2,000 1,014 4 1,000 ,782 3 1 -6,444* ,868 2 -2,000 1,014 4 -1,000 ,833 4 1 -5,444* 1,056 2 -1,000 ,782 3 1,000 ,833 Basadas en las medias marginales estimadas. *. La diferencia de medias es significativa al nivel .05. a. Ajuste para comparaciones mltiples: Bonferroni. (I)Tiempo 1

Sig.a ,033 ,000 ,005 ,033 ,504 1,000 ,000 ,504 1,000 ,005 1,000 1,000

Tabla 16.9: Matriz de transformacin parea el factor tiempo Medida:MEASURE_1 Tiempo Variable dependiente Lineal Cuadrtico Cbico Hora -,671 ,500 -,224 Dia -,224 -,500 ,671 Semana ,224 -,500 -,671 Mes ,671 ,500 ,224 33

Tabla 16.9: Matriz de transformacin parea el factor tiempo Medida:MEASURE_1 Tiempo Variable dependiente Lineal Cuadrtico Cbico Hora -,671 ,500 -,224 Dia -,224 -,500 ,671 Semana ,224 -,500 -,671 Mes ,671 ,500 ,224 a. Los contrastes de los factores intra sujetos son: Tiempo: Polynomial contraste

Tabla 16.10: Matriz SCPC correspondiente al efecto del factor tiempo Tiempo : Columna Tiempo : Fila Hiptesis Interseccin Lineal Cuadrtico Cbico Error Lineal Cuadrtico Cbico Basado en la suma de cuadrados tipo III Lineal 151,250 -100,437 -4,583 32,000 -7,901 11,333 Cuadrtico -100,437 66,694 3,044 -7,901 23,556 -10,087 Cbico -4,583 3,044 ,139 11,333 -10,087 45,111

Tabla 16.11: Matriz SCPC residual Suma de cuadrados y productos cruzados Hora Dia Semana Mes Hora Dia Semana Mes Hora 64,222 10,000 20,000 13,000 8,028 1,250 2,500 1,625 Dia 10,000 56,000 6,000 27,000 1,250 7,000 ,750 3,375 Semana 20,000 6,000 30,000 11,000 2,500 ,750 3,750 1,375 Mes 13,000 27,000 11,000 42,000 1,625 3,375 1,375 5,250 34

Covarianza

Hora Dia Semana Mes Basado en la suma de cuadrados tipo III

Correlacin

1,000 ,167 ,456 ,250

,167 1,000 ,146 ,557

,456 ,146 1,000 ,310

,250 ,557 ,310 1,000

Tabla 16.12: Prueba de esfericidad de a Bartlett Razn de verosimilitudes ,018 Chi-cuadrado aprox. 5,699 gl 9 Sig. ,778 Contrasta la hiptesis nula de que la matriz de covarianza residual es proporcional a una matriz identidad. a. Diseo: Interseccin Diseo intra-sujetos: Tiempo

Ms de una variable dependiente

35

Modelo de dos factores, ambos con medidas repetidas

36

Definicin de Variables

Editor de datos

37

Figura 16.7: Cuadro de dialogo de medidas repetidas

38

Modelo lineal general


Factores intra-sujetos Medida:MEASURE_1 Variable Tiempo Contenido dependiente 1 1 Hora_n 2 Hora_l 39

2 3 4

1 2 1 2 1 2

Dia_n Dia_l Semana_n Semana_l Mes_n Mes_l

Efecto Tiempo

Contenido

Tiempo * Contenido

Tabla 16.14: Contrastes multivariados Gl de la Valor F hiptesis a Traza de Pillai ,990 97,676 3,000 a Lambda de Wilks ,010 97,676 3,000 a Traza de Hotelling 97,676 97,676 3,000 a Raz mayor de Roy 97,676 97,676 3,000 a Traza de Pillai ,803 20,351 1,000 a Lambda de Wilks ,197 20,351 1,000 a Traza de Hotelling 4,070 20,351 1,000 a Raz mayor de Roy 4,070 20,351 1,000 a Traza de Pillai ,863 6,277 3,000 a Lambda de Wilks ,137 6,277 3,000 a Traza de Hotelling 6,277 6,277 3,000 a Raz mayor de Roy 6,277 6,277 3,000

Gl del error 3,000 3,000 3,000 3,000 5,000 5,000 5,000 5,000 3,000 3,000 3,000 3,000

Sig. ,002 ,002 ,002 ,002 ,006 ,006 ,006 ,006 ,083 ,083 ,083 ,083

a. Estadstico exacto b. Diseo: Interseccin Diseo intra-sujetos: Tiempo + Contenido + Tiempo * Contenido

40

Tabla 16.15: Prueba de esfericidad de Mauchlyb Medida:MEASURE_1 Epsilona Chi-cuadrado GreenhouseLmiteEfecto intra-sujetos W de Mauchly aprox. gl Sig. Geisser Huynh-Feldt inferior Tiempo ,418 3,246 5 ,672 ,753 1,000 ,333 Contenido 1,000 ,000 0 . 1,000 1,000 1,000 Tiempo * Contenido ,219 5,654 5 ,356 ,521 ,715 ,333 Contrasta la hiptesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional a una matriz identidad. a. Puede usarse para corregir los grados de libertad en las pruebas de significacin promediadas. Las pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos. b. Diseo: Interseccin Diseo intra-sujetos: Tiempo + Contenido + Tiempo * Contenido

Medida:MEASURE_1 Origen Tiempo

Tabla 16.16: Pruebas de efectos intra-sujetos. Suma de cuadrados tipo III 145,729 145,729 145,729 145,729 19,146 19,146 19,146 19,146 35,021 35,021 35,021 35,021 8,604 8,604 8,604 8,604 21,062 gl 3 2,260 3,000 1,000 15 11,298 15,000 5,000 1 1,000 1,000 1,000 5 5,000 5,000 5,000 3 Media cuadrtica 48,576 64,495 48,576 145,729 1,276 1,695 1,276 3,829 35,021 35,021 35,021 35,021 1,721 1,721 1,721 1,721 7,021 F 38,058 38,058 38,058 38,058 Sig. ,000 ,000 ,000 ,002

Error(Tiempo)

Contenido

Error(Contenido)

Tiempo *

Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida

20,351 20,351 20,351 20,351

,006 ,006 ,006 ,006

5,315

,011
41

Contenido

Greenhouse-Geisser Huynh-Feldt Lmite-inferior Error(Tiempo*Cont Esfericidad asumida enido) Greenhouse-Geisser Huynh-Feldt Lmite-inferior

21,062 21,062 21,062 19,813 19,813 19,813 19,813

1,562 2,145 1,000 15 7,811 10,723 5,000

13,483 9,821 21,062 1,321 2,537 1,848 3,963

5,315 5,315 5,315

,040 ,023 ,069

Otras tablas que muestra el Visor


Pruebas de contrastes intra-sujetos Medida:MEASURE_1 Origen Tiempo Conteni do Lineal Cuadrtico Cbico Error(Tiempo) Lineal Cuadrtico Cbico Contenido Error(Contenido) Tiempo * Contenido Lineal Cuadrtico Cbico Lineal Cuadrtico Cbico Lineal Lineal Lineal Lineal Lineal Lineal Lineal Lineal Suma de cuadrados tipo III 124,704 17,521 3,504 1,921 9,604 7,621 35,021 8,604 19,837 ,021 1,204 10,188 6,104 3,521 gl 1 1 1 5 5 5 1 5 1 1 1 5 5 5 Media cuadrtica F 124,704 324,61 0 17,521 9,121 3,504 ,384 1,921 1,524 35,021 20,351 1,721 19,837 ,021 1,204 2,038 1,221 ,704 9,736 ,017 1,710 ,026 ,901 ,248 ,006 2,299 Sig. ,000 ,029 ,190

Error(Tiempo*Contenido)

Pruebas de los efectos inter-sujetos Medida:MEASURE_1 Variable transformada:Promedio Suma de cuadrados tipo Media Origen III gl cuadrtica Interseccin 1131,021 1 1131,021 Error 44,604 5 8,921

F 126,784

Sig. ,000

42

Grficos de perfil

43

Medias marginales estimadas


Tabla 16.17: Estimaciones Medida:MEASURE_1 44

Tiempo 1 2 3 4

Media 7,500 5,333 3,167 3,417

Error tp. ,516 ,601 ,527 ,396

Intervalo de confianza 95% Lmite inferior Lmite superior 6,173 8,827 3,789 6,878 1,812 4,521 2,398 4,435

Comparaciones por pares Medida:MEASURE_1 Intervalo de confianza al 95 % Diferencia de (I)Tiempo 1 (J)Tiempo 2 3 4 2 1 3 4 3 1 2 4 4 1 2 medias (I-J) 2,167 4,333 4,083 -2,167 2,167
* * * * *

para la diferencia Error tp. ,477 ,401 ,271 ,477 ,494 ,523 ,401 ,494 ,544 ,271 ,523 Sig.
a

Lmite inferior ,153 2,640 2,939 -4,180 ,081 -,290 -6,027 -4,253 -2,545 -5,228 -4,124 -2,045

Lmite superior 4,180 6,027 5,228 -,153 4,253 4,124 -2,640 -,081 2,045 -2,939 ,290 2,545

,037 ,001 ,000 ,037 ,043 ,087 ,001 ,043 1,000 ,000 ,087 1,000

1,917 -4,333 -2,167


* *

-,250 -4,083
*

-1,917

3 ,250 ,544 Basadas en las medias marginales estimadas. *. La diferencia de medias es significativa al nivel .05. a. Ajuste para comparaciones mltiples: Bonferroni.

45

Tabla 16.19: Tiempo * Contenido Medida:MEASURE_1 Tiempo 1 2 3 4 Contenido 1 2 1 2 1 2 1 2 Media 5,833 9,167 4,000 6,667 2,833 3,500 3,333 3,500 Error tp. ,477 ,601 ,683 ,715 ,654 ,428 ,667 ,671 Intervalo de confianza 95% Lmite inferior Lmite superior 4,606 7,060 7,622 10,711 2,244 5,756 4,829 8,504 1,152 4,515 2,399 4,601 1,620 5,047 1,776 5,224

46

El anlisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en una variable cuantitativa. Esta prueba es una generalizacin del contraste de igualdad de medias para dos muestras independientes. Se aplica para contrastar la igualdad de medias de tres o ms poblaciones independientes y con distribucin normal. Supuestas k poblaciones independientes, las hiptesis del contraste son siguientes: Comparaciones de medias

Para realizar el contraste ANOVA, se requieren k muestras independientes de la variable de inters. Una variable de agrupacin denominada Factor y clasifica las observaciones de la variable en las distintas muestras. Suponiendo que la hiptesis nula es cierta, el estadstico utilizado en el anlisis de varianza sigue una distribucin F de Fisher-Snedecor con k-1 y n-k grados de libertad, siendo k el nmero de muestras y n el nmero total de observaciones que participan en el estudio. Ejercicio Desarrollado No 10:Base de Datos de Espesor y Presin Interna del Envase PET, con respecto a los factores Temperatura de Horneado (C) y Presin de Inyeccin (Psi)

Referente al experimento del proceso de soplado de los envases PET, consideremos el inters de averiguar la influencia del factor temperatura de horneado (C) en la Presin Interna del envase PET

47

48

TABLA DE ANALISIS DE VARIANZA PARA PROBAR LA HIPOTESIS DE IGUALDAD DE PRESIN INTERNA MEDIA DE LOS 4 NIVELES DE TEMPERATURA. PROCESAMIENTO: SPSS V 20: Analizar/Comparar medias/ Anova de un factor/Presint/Dependiente, Temper/ Factor/ En PostHoc Duncan, continuar/ En Opciones: Prueba de Homogeneidad de varianzas, continuar. 1) Trabajando con todos los datos, pero considerando slo la variable presin interna, realice el procesamiento de datos del diseo Completamente aleatorizado (siguiendo las instrucciones) e interprete sus resultados: SOLUCION USANDO SOFTWARE SPSS: 1) Defina las variables en Vista de variables
49

i) PresionInterna con 3 dgitos 0 decimales y 4 columnas ii) Temperatura con 1 dgito 0 decimales ( se ingresarn cdigos numricos para cada nivel de temperatura) , pero se debern etiquetar, para ello, ingresar en valores: Valor: 1 140 aadir Valor: 2 150 aadir Valor: 3 160 aadir Valor: 4 170 aadir, aceptar

2) En Vista de datos, aparecen dos columnas con los nombres de las variables que hemos ingresado; en la primera PresionInterna, ingrese todos los valores de la variable presin interna, ya sea por hilera o por columna y luego para la variable Temperatura, ingrese los cdigos numricos que le corresponde a cada uno de los valores ingresados.

3) En Grficos/ interactivos/ diagrama de caja/ en eje Y, Presin en eje X, temper/En Ttulo: PRESION INTERNA DEL ENVASE PET SEGN TEMPERATURA DE HORNEADO, aceptar. Visualice e interprete el grfico

50

51

4) En analizar: Comparar medias / ANOVA de un factor. Seleccione e ingrese las variables: PresionInterna en Variable dependiente, Temperatura en Factor. En PostHoc seleccionar Duncan, continuar/ En Opciones: Prueba de Homogeneidad de varianzas, continuar/ aceptar

52

PRUEBA DE LEVENE DE HOMOGENEIDAD DE VARIANZAS

Ho: = = ( varianzas homogneas ) H1: > ( varianzas heterogneas ) Para probar la hiptesis de igualdad de 2 ms medias poblacionales, se requiere verificar el cumplimiento del supuesto bsico de homogeneidad de varianzas
Prueba de homogeneidad de varianzas Presin Interna Estadstico de gl1 gl2 Sig. Levene 1,309 3 12 ,317

La tabla anterior presenta los contrastes ad hoc de homogeneidad de varianzas para los grupos determinados por la variable temperatura en la variable dependiente presin interna (como los valores p son mayores que el valor de significancia, 0.317 > 0.05, se acepta la hiptesis nula Ho, es decir se acepta la homogeneidad de varianzas)
ANOVA de un factor Presin Interna Suma de cuadrados 119,500 31,500 151,000 gl 3 12 15 Media cuadrtica 39,833 2,625 F 15,175 Sig. ,000

Inter-grupos Intra-grupos Total

53

Pruebas post hoc Subconjuntos homogneos


Presin Interna Duncan Temperatura 140 150 160 170 Sig. N 4 4 4 4 ,297 Subconjunto para alfa = 0.05 1 2 121,50 122,75 126,50 128,25 ,153

Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 4,000.

5) En analizar: Modelo Lineal General / Univariante/ Presin Interna a Dependiente, Temperatura a Factores fijos/ En PostHoc, PostHoc marque Duncan, continuar/ En Opciones: Prueba de Homogeneidad, continuar/ Aceptar

54

6) Visualice los resultados e Interprtelos Anlisis de varianza univariante


Factores inter-sujetos Etiqueta del valor 1 140 2 150 3 160 4 170 Factores inter-sujetos Etiqueta del valor 1 140 2 150 3 160 4 170 N 4 4 4 4

Temperatura

N 4 4 4 4 55

Temperatura

Pruebas de los efectos inter-sujetos Variable dependiente: Presion Interna Origen Suma de gl Media cuadrados tipo cuadrtica III a Modelo corregido 119,500 3 39,833 Interseccin 249001,000 1 249001,000 Temperatura 119,500 3 39,833 Error 31,500 12 2,625 Total Total corregida 249152,000 151,000 16 15

Sig.

15,175 94857,524 15,175

,000 ,000 ,000

a. R cuadrado = ,791 (R cuadrado corregida = ,739)

TABLA DE ANALISIS DE VARIANZA PARA PROBAR LA HIPOTESIS DE IGUALDAD DE PRESIN INTERNA MEDIA DE LOS 4 NIVELES DE TEMPERATURA.

Como el valor p o valor de significacin es = 0.000 < 0.01, decimos que: Los datos nos proporcionan suficiente evidencia para concluir que existe diferencia altamente significativa entre las presiones internas medias del envase PET, obtenida con las diferentes temperaturas. Ahora nos falta determinar cul es el mejor tratamiento. Para ello utilizamos un mtodo de comparacin mltiple: Pruebas post hoc Temperatura Subconjuntos homogneos
Presin Interna Duncan Temperatura 140 150 160 170 Sig. N 1 4 4 4 4 ,297 121,50 122,75 126,50 128,25 ,153 Subconjunto 2

Se muestran las medias de los grupos de subconjuntos homogneos. Basadas en las medias observadas. El trmino de error es la media cuadrtica(Error) = 2,625. a. Usa el tamao muestral de la media armnica = 4,000 b. Alfa = ,05.

56

También podría gustarte