Teoría y Ejemplo Regresión Lineal

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

MARCO TEÓRICO

 Concepto de regresión:

El análisis de regresión engloba a un conjunto de métodos estadísticos que usamos


cuando tanto la variable de dependiente como la la(s) variable(s) independiente(s) son
contínuas y queremos predecir valores de la primera en función de valores observados de
las segundas. En esencia, el análisis de regresión consiste en ajustar un modelo a los datos,
estimando coeficientes a partir de las observaciones, con el fin de predecir valores de la
variable de dependiente a partir de una (regresión simple) o más variables (regresión
múltiple) predictivas o explicativas.

La ecuación resultante estará dada por:

Y =b0 +b1 x 1+ b2 x 2 +…

Siendo X1 y X2, las variables independientes de las cuales depende el valor de la variable
dependiente Y, los coeficientes b1 y b2 los coeficientes de las distintas variables y el valor
de b0 vendría a ser la intercepción de estos valores.

 Coeficiente de regression multiple R y R2

Se define el coeficiente de regresión múltiple como la correlación existente entre la


variable dependiente (Y) y el conjunto de las variables independientes contempladas en el
modelo. A diferencia del coeficiente de correlación simple, el coeficiente de correlación
multiple es siempre positivo.

El cuadrado del coeficiente de correlación múltiple representa la proporción de la


variabilidad de Y explicada por el conjunto de las Xs, es decir por el componente
explicativo, conocido o determinista del modelo. Como complemento, 1- 2 R constituye
como sabemos la proporción de variación no explicada o residual atribuida al efecto de
factores aleatorios y desconocidos, ajenos a las variables predictoras analizadas.

 Validación del modelo

Como se sabe, validar un modelo de regresión consiste en analizar si la variabilidad de la


variable criterio (Y) atribuida a la regresión –en este caso al efecto del conjunto de
variables predictoras- es lo suficientemente grande con respecto a la variabilidad no
explicada o residual. El índice F constituye una prueba estadística pertinente para evaluar
dicha relación.

La probabilidad (p) asociada al resultado de dicha prueba indica el grado de certidumbre


con el que podemos concluir que numerador -parte explicativa del modelo- y
denominador -parte borrosa o residual- coinciden, es decir, que lo determinado o
explicativo se confunde con –o es lo mismo a- lo borroso del modelo. Si dicha probabilidad
es pequeña (p<.05) concluimos que la parte explicativa supera en cantidad suficiente a la
no explicada, por lo que las variables determinadas como relevantes por el modelo se
consideran significativas en su conjunto-.

Pregunta 3
Determinar el peso que tendría una dama que tiene las características siguientes:

 Estatura: 165 cm
 L. pie: 36.5 cm
 L. Brazo: 72 cm
 A. Espalda: 41 cm
 Diámetro de cráneo: 57 cm
 Longitud del rostro: 44.5 cm
Teniendo los datos siguientes:

Y x1 x2 x3 x4 x5 x6
N Peso Estatura L. Pie L. Brazo A. Espalda D. Craneo L. Rostro
1 43 158 36 68 43 55 39
2 45 152 34 66 40 55 38
3 52 168 39 72 41 54 43
4 49 159 36 68 42 57 40
5 50 158 36 68 44 57 41
6 51 164 35 71 44 54 40
7 52 156 36 67 36 56 41
8 54 167 37 73 41 58 44
Al procesar los datos en el programa Excel, obtenemos los siguientes
resultados:
 R2=0.988
 R2 ajustado=0.915
 valor crítico F=0.2053
Como el valor crítico de F, debe ser menor a 0.05, evaluaremos los
valores de R2 de cada variable independiente para encontrar aquellos
con baja incidencia:
 R2 estatura=0.4324
 R2 L. Pie=0.261
 R2 L. Brazo=0.4303
 R2 A . Espalda=0.0512
 R2 D. cráneo=0.095
 R2 L. Rostro=0.7184
Entonces no tomaremos el valor de A. Espalda por su baja incidencia,
con la nueva regresión lineal múltiple, obtenemos los siguientes
resultados:
 R2=0.981
 R2 ajustado=0.936
 valor crítico F=0.0452
Ya que los valores son admisibles, utilizaremos los coeficientes dados
por esta distribución:
 b 0=59.765
 b 1=2.043
 b 2=−4.008
 b 3=−4.66
 b 5=−0.859
 b 6=4.346

Los valores de X dados por el problema:


 x 1=165 cm
 x 2=36.5 cm
 x 3=72 cm
 x 5=57 cm
 x 6=44.5 cm

Por lo tanto, el valor de la estatura de una mujer con las


dimensiones dadas será:
Y =59.765+ 2.043∗165+ (−4.008 )∗36.5+ (−4.66 )∗72+ (−0.859 )∗57+4.346∗44.5

Y =59.53 kg

Recomendaciones:
 Revisar el nivel de incidencia de cada una de las variables independientes
en la variable dependiente para tener un resultado más cercano al valor
real.
 No olvidar revisar los valores de R 2 y F crítico para ver si los valores
tomados tienen un adecuado nivel de confiabilidad.
Bibliografía:
 Avelarde. Análisis Dos. Regression lineal multiple
 Pablo Vinuesa. Regresión Lineal simple y Polinomial: teoría y práctica

También podría gustarte