Definición de la regresión lineal múltiple (MLR)

Qué es la regresión lineal múltiple (MLR)?

La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta. El objetivo de la regresión lineal múltiple es modelar la relación lineal entre las variables explicativas (independientes) y las variables de respuesta (dependientes). En esencia, la regresión múltiple es la extensión de la regresión por mínimos cuadrados ordinarios (MCO) porque incluye más de una variable explicativa.

Puntos clave

  • La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta.
  • La regresión múltiple es una extensión de la regresión lineal (MCO) que utiliza sólo una variable explicativa.
  • La MLR se utiliza mucho en econometría y en inferencia financiera.

Fórmula y cálculo de la regresión lineal múltiple

y i = β 0 + β 1 x i 1 + β 2 x i 2 + . . . + β p x i p + ϵ donde,

para

i = n

observaciones: y i = variable dependiente x i = variables explicativas β 0 = Intercepción y (término constante) β p = coeficientes de pendiente para cada variable explicativa ϵ = el término de error del modelo (también conocido como los residuos) \ϵχήήήή<ς&y_i = \beta_0 + \beta _1 x_{i1} + \beta _2 x_{i2} + ... + \beta _p x_{ip} + \epsilon\\\\\\\Nde&\donde, para i = n observaciones&y_i=\Ntexto{variable dependiente}\Nde la variable independiente&x_i=\ctexto{variables{explicativas}\c&\beta_0=\text{y-intercepto (término constante)}\\\n&\beta_p=\text{combinación de los coeficientes de cada variable explicativa}\\\\\N&\\N-epsilon=\Ntexto{el término de error del modelo (también conocido como los residuos)}\N-fin ​yi​=β0​+β1​xi1​+β2​xi2​+…+βpxip+ϵdonde, para i=n observaciones:yi=variable dependientexi=variables explicativasβ0=intercepción de y (término constante)βp=coeficientes de pendiente para cada variable explicativaϵ=el término de error del modelo (también conocido como los residuos)

Lo que la regresión lineal múltiple puede decirle

La regresión lineal simple es una función que permite a un analista o estadístico hacer predicciones sobre una variable basándose en la información que se conoce sobre otra variable. La regresión lineal sólo puede utilizarse cuando se tienen dos variables continuas: una variable independiente y una variable dependiente. La variable independiente es el parámetro que se utiliza para calcular la variable dependiente o resultado. Un modelo de regresión múltiple se extiende a varias variables explicativas.

El modelo de regresión múltiple se basa en los siguientes supuestos

  • Existe una relación lineal entre las variables dependientes y las independientes
  • Las variables independientes no están demasiado correlacionadas entre sí
  • yi las observaciones se seleccionan de forma independiente y aleatoria de la población
  • Los residuos deben distribuirse normalmente con una media de 0 y una varianza σ

El coeficiente de determinación (R-cuadrado) es una métrica estadística que se utiliza para medir qué parte de la variación del resultado puede explicarse por la variación de las variables independientes. R2 siempre aumenta a medida que se añaden más predictores al modelo MLR, aunque los predictores no estén relacionados con la variable de resultado.

Por tanto, la R2 no puede utilizarse por sí sola para identificar los predictores que deben incluirse en un modelo y los que deben excluirse. R2 sólo puede estar entre 0 y 1, donde 0 indica que el resultado no puede predecirse por ninguna de las variables independientes y 1 indica que el resultado puede predecirse sin error a partir de las variables independientes.

Al interpretar los resultados de la regresión múltiple, los coeficientes beta son válidos manteniendo todas las demás variables constantes ("todo lo demás igual"). El resultado de una regresión múltiple puede mostrarse horizontalmente como una ecuación, o verticalmente en forma de tabla.

Ejemplo de uso de la regresión lineal múltiple

Como ejemplo, un analista puede querer saber cómo afecta el movimiento del mercado al precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendrá el valor de la S&Índice P 500 como variable independiente, o predictor, y el precio de XOM como variable dependiente.

En realidad, hay múltiples factores que predicen el resultado de un evento. El movimiento del precio de ExxonMobil, por ejemplo, depende de algo más que del comportamiento del mercado en general. Otros predictores, como el precio del petróleo, los tipos de interés y el movimiento de los precios de los futuros del petróleo, pueden afectar al precio de XOM y a las cotizaciones de otras empresas petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple.

La regresión lineal múltiple (MLR) se utiliza para determinar una relación matemática entre varias variables aleatorias. En otros términos, la MLR examina cómo se relacionan múltiples variables independientes con una variable dependiente. Una vez que se ha determinado que cada uno de los factores independientes predice la variable dependiente, la información sobre las múltiples variables puede utilizarse para crear una predicción precisa sobre el nivel de efecto que tienen en la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales.

Refiriéndonos a la ecuación MLR anterior, en nuestro ejemplo

  • yi = variable dependiente: el precio de XOM
  • xi1 = tipos de interés
  • xi2 = precio del petróleo
  • xi3 = valor de S&Índice P 500
  • xi4= precio de los futuros del petróleo
  • B0 = intersección y en el momento cero
  • B1 = coeficiente de regresión que mide un cambio unitario en la variable dependiente cuando xi1 cambios – el cambio en el precio de XOM cuando los tipos de interés cambian
  • B2 = valor del coeficiente que mide un cambio unitario en la variable dependiente cuando xi2 cambia-el cambio en el precio de XOM cuando los precios del petróleo cambian

Las estimaciones por mínimos cuadrados-B0, B1, B2…Bp-suelen calcularse con un software estadístico. Se pueden incluir tantas variables en el modelo de regresión en el que cada variable independiente se diferencia con un número-1,2, 3, 4…p. El modelo de regresión múltiple permite a un analista predecir un resultado basándose en la información proporcionada sobre múltiples variables explicativas.

Aun así, el modelo no siempre es perfectamente preciso, ya que cada punto de datos puede diferir ligeramente del resultado predicho por el modelo. El valor residual, E, que es la diferencia entre el resultado real y el resultado previsto, se incluye en el modelo para tener en cuenta esas ligeras variaciones.

Suponiendo que ejecutamos nuestro modelo de regresión de precios de XOM a través de un software de cálculo estadístico, que devuelve este resultado:

Imagen de Sabrina Jiang © Nuestro equipo 2020

Un analista interpretaría este resultado como que, si las demás variables se mantienen constantes, el precio de XOM aumentará un 7.8% si el precio del petróleo en los mercados aumenta un 1%. El modelo también muestra que el precio de XOM disminuirá en 1.5% tras una subida del 1% de los tipos de interés. R2 indica que 86.El 5% de las variaciones en el precio de las acciones de Exxon Mobil puede explicarse por los cambios en el tipo de interés, el precio del petróleo, los futuros del petróleo y S&Índice P 500.

La diferencia entre la regresión lineal y la múltiple

La regresión lineal ordinaria (OLS) compara la respuesta de una variable dependiente ante un cambio en algunas variables explicativas. Sin embargo, una variable dependiente rara vez se explica por una sola variable. En este caso, un analista utiliza la regresión múltiple, que intenta explicar una variable dependiente utilizando más de una variable independiente. Las regresiones múltiples pueden ser lineales y no lineales.

Las regresiones múltiples se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. También supone que no hay una correlación importante entre las variables independientes.

Qué hace un múltiplo de regresión?

Una regresión múltiple considera el efecto de más de una variable explicativa sobre algún resultado de interés. Evalúa el efecto relativo de estas variables explicativas, o independientes, sobre la variable dependiente cuando se mantienen constantes todas las demás variables del modelo.

¿Por qué utilizar una regresión múltiple en lugar de una simple regresión OLS??

Una variable dependiente rara vez se explica por una sola variable. En estos casos, un analista utiliza la regresión múltiple, que intenta explicar una variable dependiente utilizando más de una variable independiente. El modelo, sin embargo, supone que no hay correlaciones importantes entre las variables independientes.

¿Puedo hacer una regresión múltiple a mano??

Es poco probable, ya que los modelos de regresión múltiple son complejos y lo son aún más cuando se incluyen más variables en el modelo o cuando aumenta la cantidad de datos que hay que analizar. Para llevar a cabo una regresión múltiple, es probable que tenga que utilizar software estadístico especializado o funciones dentro de programas como Excel.

¿Qué significa que una regresión múltiple sea lineal??

En la regresión lineal múltiple, el modelo calcula la línea de mejor ajuste que minimiza las varianzas de cada una de las variables incluidas en relación con la variable dependiente. Porque se ajusta a una línea, es un modelo lineal. También existen modelos de regresión no lineal que incluyen múltiples variables, como la regresión logística, la regresión cuadrática y los modelos probit.

¿Cómo se utilizan los modelos de regresión múltiple en finanzas??

Cualquier modelo econométrico que considere más de una variable puede ser un múltiplo. Los modelos factoriales comparan dos o más factores para analizar las relaciones entre las variables y el rendimiento resultante. El modelo de tres factores de Fama y French es un modelo de este tipo que amplía el modelo de valoración de activos de capital (CAPM) añadiendo factores de riesgo de tamaño y de valor al factor de riesgo de mercado del CAPM (que es en sí mismo un modelo de regresión). Al incluir estos dos factores adicionales, el modelo se ajusta a esta tendencia de superación, lo que se cree que lo convierte en una mejor herramienta para evaluar el rendimiento de los gestores.

Dodaj komentarz