Qué es la línea de mejor ajuste
La línea de mejor ajuste se refiere a la línea que atraviesa un gráfico de dispersión de puntos de datos y que mejor expresa la relación entre esos puntos. Los estadísticos suelen utilizar el método de los mínimos cuadrados para llegar a la ecuación geométrica de la línea, ya sea mediante cálculos manuales o mediante un software de análisis de regresión. Una línea recta será el resultado de un análisis de regresión lineal simple de dos o más variables independientes. Una regresión con múltiples variables relacionadas puede producir una línea curva en algunos casos.
1:00
Línea de mejor ajuste
Fundamentos de la línea de mejor ajuste
La línea de mejor ajuste es uno de los resultados más importantes del análisis de regresión. La regresión se refiere a una medida cuantitativa de la relación entre una o más variables independientes y una variable dependiente resultante. La regresión es útil para los profesionales de una amplia gama de campos, desde la ciencia y la administración pública hasta el análisis financiero.
Para realizar un análisis de regresión, un estadístico recoge un conjunto de puntos de datos, cada uno de los cuales incluye un conjunto completo de variables dependientes e independientes. Por ejemplo, la variable dependiente podría ser el precio de las acciones de una empresa y las variables independientes podrían ser el índice Standard and Poor’s 500 y la tasa de desempleo nacional, suponiendo que las acciones no cotizan en el índice S&P 500. El conjunto de muestras podría ser cada uno de estos tres conjuntos de datos de los últimos 20 años.
En un gráfico, estos puntos de datos aparecerían como un diagrama de dispersión, un conjunto de puntos que pueden o no parecer organizados a lo largo de alguna línea. Si se observa un patrón lineal, puede ser posible trazar una línea de mejor ajuste que minimice la distancia de esos puntos a esa línea. Si no hay un eje organizador aparente, el análisis de regresión puede generar una línea basada en el método de los mínimos cuadrados. Este método construye la línea que minimiza la distancia al cuadrado de cada punto con respecto a la línea de mejor ajuste.
Para determinar la fórmula de esta línea, el estadístico introduce estos tres resultados de los últimos 20 años en una aplicación informática de regresión. El software produce una fórmula lineal que expresa la relación causal entre las variables S&P 500, la tasa de desempleo y la cotización de la empresa en cuestión. Esta ecuación es la fórmula de la línea de mejor ajuste. Es una herramienta de predicción que proporciona a los analistas y operadores un mecanismo para proyectar el precio futuro de las acciones de la empresa en función de esas dos variables independientes.
La ecuación de la línea de mejor ajuste y sus componentes
Una regresión con dos variables independientes como la del ejemplo anterior producirá una fórmula con esta estructura básica:
y= c + b1(x1) + b2(x2)
En esta ecuación, y es la variable dependiente, c es una constante, b1 es el primer coeficiente de regresión y x1 es la primera variable independiente. El segundo coeficiente y la segunda variable independiente son b2 y x2. A partir del ejemplo anterior, el precio de las acciones sería y, la S&P 500 sería x1 y la tasa de desempleo sería x2. El coeficiente de cada variable independiente representa el grado de cambio en y por cada unidad adicional en esa variable. Si la S&P 500 se incrementa en uno, el precio de la acción o y resultante subirá en la cantidad del coeficiente. Lo mismo ocurre con la segunda variable independiente, la tasa de desempleo. En una regresión simple con una variable independiente, ese coeficiente es la pendiente de la línea de mejor ajuste. En este ejemplo o en cualquier regresión con dos variables independientes, la pendiente es una mezcla de los dos coeficientes. La constante c es la intersección y de la línea de mejor ajuste.
Puntos clave
- La recta de mejor ajuste se utiliza para expresar una relación en un gráfico de dispersión de diferentes puntos de datos.
- Es un resultado del análisis de regresión y puede utilizarse como herramienta de predicción de indicadores y movimientos de precios.