Sixsigma Analisis de Regresion y Correlacion
Sixsigma Analisis de Regresion y Correlacion
CORRELACIÓN
Page 1
Análisis de regresión
Page 3
Tipos de Relaciones
Page 4
REGRESIÓN Y CORRELACIÓN SIMPLE
Es analizar el grado de la
relación existente entre
variables utilizando modelos
matemáticos y
representaciones gráficas.
Así pues, para representar
la relación entre dos o más
variables desarrollaremos
una ecuación que permitirá
estimar una variable en
función de la otra.
Page 5
Diagrama de Dispersión
Page 6
DIAGRAMA DE DISPERSIÓN
r = Coeficiente de Pearson, nos indica que tan fuerte es la relación
entre x e y
2
1
r = 0.02
0,75
0
0 0,2 0,4 0,6 0,8 1 0,5 Si: 0.8 ≤ r ≤ 1.0
0,25
6
0
r = 0.99
0 0,25 0,5 0,75 1 4
0
0 0,2 0,4 0,6 0,8 1
Page 7
Análisis de regresión simple
Page 8
Aplicación N°1 del análisis de regresión simple
Page 9
Solucionario del Ejercicio
(x i x )( yi y )
49
b i 1
N
0.594
82.5
( xi x ) 2
i 1
Yˆ 0.533 0.594 X i
Page 10
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.857277672
Coeficiente de determinación R^2 0.734925008
R^2 ajustado 0.701790634
Error típico 1.145478595
Observaciones 10
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de Valor
de los F
libertad cuadrados crítico de F
cuadrados
Regresión 1 29.1030303 29.1030303 22.1801386 0.0015225
Residuos 8 10.4969697 1.31212121
Total 9 39.6
Inferior Superior In
Coeficientes Error típico Estadístico t Probabilidad
95% 95% 9
Intercepción 0.533333333 0.782510851 0.681566693 0.514755471 -1.27113993 2.33780659 -1.2
x 0.593939394 0.126113043 4.709579447 0.001522502 0.3031222 0.88475659 0.
Page 11
Se verifica la
Correlación de
variables
Page 12
Correlaciones: x, y
Page 13
Page 14
Análisis de regresión: y vs. x
La ecuación de regresión es
y = 0.533 + 0.594 x
Coef.
Predictor Coef de EE T P
Constante 0.5333 0.7825 0.68 0.515
x 0.5939 0.1261 4.71 0.002
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 29.103 29.103 22.18 0.002
Error residual 8 10.497 1.312
Page 15
Total 9 39.600
APLICACIÓN N°2 DEL ANÁLISIS DE REGRESIÓN SIMPLE
X 5 7 6 5 1 5 4 8 6 10 9 6
Y 6,000 8,500 9,000 5,000 3,800 5,700 6,500 10,200 8,000 12,500 11,300 9,500
Page 16
X Y XX Y Y ( X X)2 XX
*YY
Page 17
XX =6 Y Y = 8000
Recta de regresión mínimo cuadrática:
N
(x i x )( yi y )
64100
b i 1
N
1033 .87097
62
( xi x ) 2
i 1
Page 18
Teniendo los valores de “a” y “b”. a=1 796 b=1 034
Reemplazamos en la ecuación lineal:
Page 19
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.923769229
Coeficiente de determinación R^2 0.853349588
R^2 ajustado 0.838684547
Error típico 1067.186533
Observaciones 12
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
libertad cuadrados cuadrados F Valor crítico de F
Regresión 1 66271129.03 66271129.03 58.18937559 1.78201E-05
Residuos 10 11388870.97 1138887.097
Total 11 77660000
Page 20
Correlaciones: X, Y
La ecuación de regresión es
Y = 1797 + 1034 X
Coef.
Predictor Coef de EE T P
Constante 1796.8 869.6 2.07 0.066
X 1033.9 135.5 7.63 0.000
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 66271129 66271129 58.19 0.000
Error residual 10 11388871 1138887
Total 11 77660000
Page 21
Page 22
La correlación es otra medida de mutua relación entre dos variables
Page 24
N
S xy ( x x )( y y )
i i
rxy N
i 1
N
S x .S y
i
( x
i 1
x ) 2
. i
( y
i 1
y ) 2
y = a+bx
a = 81.048
b = 0.964
r2 = 0.8040 (los datos forman una línea recta)
r = 0.8967 (Hay una correlación directa positiva)
Page 25
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.89667281
Coeficiente de determinación R^2 0.80402214
R^2 ajustado 0.75502767
Error típico 5.64109082
Observaciones 6
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 522.212378 522.212378 16.4104684 0.01546317
Residuos 4 127.287622 31.8219056
Total 5 649.5
Page 26
Correlaciones: Presión (y), Edad (x)
La ecuación de regresión es
Presión (y) = 81.0 + 0.964 Edad (x)
Coef.
Predictor Coef de EE T P
Constante 81.05 13.88 5.84 0.004
Edad (x) 0.9644 0.2381 4.05 0.015
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 522.21 522.21 16.41 0.015
Error residual 4 127.29 31.82
Total 5 649.50
Page 27
CORRELACIÓN
AÑOS 1 20 6 8 2 1 15 8
DESEMPEÑO 43 97 59 66 44 42 89 65
Page 28
Cuadro de Estandarización: Años de Servicios / Desempeño
Page 29
Recta de regresión mínimo cuadrática:
N
(x i x )( yi y )
999.375
b i 1
N
3.0295
329.875
( xi x ) 2
i 1
Yˆ 40.025 3.0295 X i
Page 30
N
S xy ( x x )( y y )
i i
rxy N
i 1
N
S x .S y
( x x ) . ( y y)
i 1
i
2
i 1
i
2
y = a+bX
a = 40.025
b = 3.0295
r2 = 0.9885 (los datos forman una línea recta)
r = 0.9942 (Hay una correlación directa positiva)
Page 31
Page 32
Page 33
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.994235218
Coeficiente de determinación R^2 0.98850367
R^2 ajustado 0.986587615
Error típico 2.422527009
Observaciones 8
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 3027.66318 3027.66318 515.9056729 4.7688E-07
Residuos 6 35.2118227 5.86863711
Total 7 3062.875
Page 34
Correlaciones: Experiencia (x), Desempeño (y)
La ecuación de regresión es
Desempeño (y) = 40.0 + 3.03 Experiencia (x)
Coef.
Predictor Coef de EE T P
Constante 40.025 1.330 30.10 0.000
Experiencia (x) 3.0296 0.1334 22.71 0.000
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 3027.7 3027.7 515.91 0.000
Error residual 6 35.2 5.9
Total 7 3062.9
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 234 234 30.7894737 0.01154206
Residuos 3 22.8 7.6
Total 4 256.8
In
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% 9
Intercepción 19.2 7.66891829 2.50361254 0.08742786 -5.20592067 43.6059207 -5.2
Variable X 1 3 0.54065487 5.54882633 0.01154206 1.2793949 4.7206051 1.
Page 37
Correlaciones: x, y
La ecuación de regresión es
y = 19.2 + 3.00 x
Coef.
Predictor Coef de EE T P
Constante 19.200 7.669 2.50 0.087
x 3.0000 0.5407 5.55 0.012
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 234.00 234.00 30.79 0.012
Error residual 3 22.80 7.60
Total 4 256.80
Page 38
Ejercicio N°6
Estatura x del 65 63 67 64 68 62 70 66 68 67 69 71
padre (in)
Estatura y del 68 66 68 65 69 66 68 65 71 67 68 70
hijo (in)
Page 39
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.70265165
Coeficiente de determinación R^2 0.49371933
R^2 ajustado 0.44309127
Error típico 1.40366506
Observaciones 12
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 19.2139108 19.2139108 9.75188997 0.01082225
Residuos 10 19.7027559 1.97027559
Total 11 38.9166667
Page 40
Correlaciones: Estatura x del padre (in), Estatura y del hijo (in)
Correlación de Pearson de Estatura x del padre (in) y Estatura y del hijo (in) = 0.703
Valor P = 0.011
La ecuación de regresión es
Estatura y del hijo (in) = 35.8 + 0.476 Estatura x del padre (in)
Coef.
Predictor Coef de EE T P
Constante 35.82 10.18 3.52 0.006
Estatura x del padre (in) 0.4764 0.1525 3.12 0.011
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 19.214 19.214 9.75 0.011
Error residual 10 19.703 1.970
Total 11 38.917
Estatura x Estatura
del padre y del Residuo
Obs (in) hijo (in) Ajuste Ajuste SE Residuo estándar
9 68.0 71.000 68.219 0.453 2.781 2.09R