la regresión lineal múltiple es un método que podemos usar para comprender la relación entre dos o más variables explicativas y una variable de respuesta.
este tutorial explica cómo realizar regresión lineal múltiple en Excel.
Nota: Si solo tiene una variable explicativa, debe realizar una regresión lineal simple.,
ejemplo: regresión lineal múltiple en Excel
supongamos que queremos saber si el número de horas pasadas estudiando y el número de exámenes de preparación tomados afecta la puntuación que recibe un estudiante en un determinado examen de ingreso a la Universidad.
para explorar esta relación, podemos realizar regresión lineal múltiple utilizando las horas estudiadas y los exámenes prep tomados como variables explicativas y la puntuación del examen como variable de respuesta.
realice los siguientes pasos en Excel para realizar una regresión lineal múltiple.
Paso 1: Introduzca los datos.,
ingrese los siguientes datos para el número de horas estudiadas, exámenes de preparación realizados y puntaje de examen recibido para 20 estudiantes:
Paso 2: Realizar regresión lineal múltiple.
a lo largo de la cinta superior en Excel, vaya a la pestaña Datos y haga clic en Análisis de datos. Si no ve esta opción, primero debe instalar el ToolPak de análisis gratuito.
Una vez que haga clic en Análisis de datos, aparecerá una nueva ventana. Seleccione regresión y haga clic en Aceptar.,
para el rango y de entrada, rellene la matriz de valores para la variable de respuesta. Para Input X Range, rellene el array de valores para las dos variables explicativas. Marque la casilla junto a etiquetas para que Excel sepa que incluimos los nombres de las variables en los rangos de entrada. Para Rango de salida, seleccione una celda donde desea que aparezca la salida de la regresión. A continuación, haga clic en Aceptar.
El siguiente resultado aparecerá automáticamente:
Paso 3: Interpretar la salida.,
Aquí está cómo interpretar los números más relevantes en la salida:
R cuadrado: 0.734. Esto se conoce como el coeficiente de determinación. Es la proporción de la varianza en la variable de respuesta que puede ser explicada por las variables explicativas. En este ejemplo, el 73,4% de la variación en las puntuaciones de los exámenes se puede explicar por el número de horas estudiadas y el número de exámenes de preparación realizados.error estándar: 5.366. Esta es la distancia promedio que los valores observados caen de la línea de regresión. En este ejemplo, los valores observados caen un promedio de 5.,366 unidades de la línea de regresión.
F: 23.46. Este es el estadístico global F para el modelo de regresión, calculado como regresión MS / MS residual.
significación F: 0,0000. Este es el valor p asociado con la estadística general de F. Nos dice si el modelo de regresión en su conjunto es estadísticamente significativo o no. En otras palabras, nos dice si las dos variables explicativas combinadas tienen una asociación estadísticamente significativa con la variable de respuesta. En este caso el valor p es menor que 0.,05, lo que indica que las variables explicativas horas estudiadas y exámenes prep tomados combinados tienen una asociación estadísticamente significativa con la puntuación del examen.
P-valores. Los valores de p individuales nos dicen si cada variable explicativa es estadísticamente significativa o no. Podemos ver que las horas estudiadas son estadísticamente significativas (p = 0.00) mientras que los exámenes prep realizados (p = 0.52) no son estadísticamente significativos en α = 0.05. Dado que los exámenes de preparación tomados no son estadísticamente significativos, podemos terminar decidiendo eliminarlo del modelo.,
coeficientes: los coeficientes para cada variable explicativa nos dicen el cambio esperado promedio en la variable de respuesta, asumiendo que la otra variable explicativa permanece constante. Por ejemplo, por cada hora adicional dedicada al estudio, se espera que el puntaje promedio del examen aumente en 5.56, suponiendo que los exámenes de preparación realizados se mantengan constantes.
Aquí hay otra manera de pensar sobre esto: si el estudiante A y el estudiante B toman la misma cantidad de exámenes de preparación, pero el estudiante a estudia una hora más, entonces se espera que el estudiante a gane una puntuación que es 5.56 puntos más que el estudiante B.,
interpretamos que el coeficiente de intercepción significa que la puntuación esperada del examen para un estudiante que estudia cero horas y toma cero exámenes de preparación es de 67.67.
ecuación de regresión estimada: podemos usar los coeficientes de la salida del modelo para crear la siguiente ecuación de regresión estimada:
puntuación del examen = 67.67 + 5.56*(horas) – 0.60*(exámenes de Preparación)
podemos usar esta ecuación de regresión estimada para calcular la puntuación esperada del examen para un estudiante, basada en el número de horas que estudian y el número de exámenes de preparación que toman., Por ejemplo, se espera que un estudiante que estudia durante tres horas y toma un examen de preparación reciba una puntuación de 83.75:
= 67.67 + 5.56*(3) – 0.60*(1) = 83.75
tenga en cuenta que debido a que los exámenes de prep tomados no fueron estadísticamente significativos (p = 0.52), podemos decidir eliminarlo porque no agrega ninguna mejora al modelo general. En este caso, podríamos realizar una regresión lineal simple usando solo las horas estudiadas como variable explicativa.
los resultados de este análisis de regresión lineal simple se pueden encontrar aquí.