Definición de desviación típica residual

Qué es la desviación estándar residual?

La desviación estándar residual es un término estadístico que se utiliza para describir la diferencia entre las desviaciones estándar de los valores observados y los valores predichos, tal y como se muestra en los puntos de un análisis de regresión.

El análisis de regresión es un método utilizado en estadística para mostrar una relación entre dos variables diferentes, y para describir lo bien que se puede predecir el comportamiento de una variable a partir del comportamiento de otra.

La desviación estándar del residuo también se conoce como la desviación estándar de los puntos alrededor de una línea ajustada o el error estándar de estimación.

Puntos clave

  • La desviación estándar residual es la desviación estándar de los valores residuales, o la diferencia entre un conjunto de valores observados y predichos.
  • La desviación estándar de los residuos calcula la dispersión de los puntos de datos en torno a la línea de regresión.
  • El resultado se utiliza para medir el error de predicción de la línea de regresión.
  • Cuanto menor sea la desviación estándar residual en comparación con la desviación estándar de la muestra, más predictivo, o útil, es el modelo.

Entender la desviación estándar residual

La desviación estándar de los residuos es una medida de bondad de ajuste que puede utilizarse para analizar el grado de ajuste de un conjunto de puntos de datos con el modelo real. En un entorno empresarial, por ejemplo, tras realizar un análisis de regresión sobre múltiples puntos de datos de costes a lo largo del tiempo, la desviación estándar residual puede proporcionar a un empresario información sobre la diferencia entre los costes reales y los costes proyectados, y una idea de cuánto podrían variar los costes proyectados con respecto a la media de los datos de costes históricos.

Fórmula de la desviación típica residual

Residual = ( Y Y e s t ) S r e s = ( Y Y e s t ) 2 n 2 donde: S r e s = Desviación estándar residual Y = Valor observado Y e s t = Valor estimado o proyectado n = Puntos de datos en la población |aligned} &\text{Residual}=\left(Y-Y_{est}\right)\\ &S_{res}=\sqrt{\frac{\sum \left(Y-Y_{est}\right)^2}{n-2}}\\ &\textbf{donde:}\\\\\\️ &S_{res}={texto} {desviación estándar residual}\\N &Y=\texto{Valor observado}\\\bara &Y_{est}={texto} {valor estimado o proyectado}{\} &n=\texto{puntos de datos en la población}\\\\final{alineado} Residual=(Y-Yest)Sres=n-2∑(Y-Yest)2donde:Sres=Desviación estándar residualY=Valor observadoYest=Valor estimado o proyectadouen=Puntos de datos en la población

Cómo calcular la desviación estándar residual

Para calcular la desviación típica residual, hay que calcular primero la diferencia entre los valores previstos y los valores reales que se forman alrededor de una línea ajustada. Esta diferencia se conoce como valor residual o, simplemente, residuos o la distancia entre los puntos de datos conocidos y los puntos de datos predichos por el modelo.

Para calcular la desviación típica residual, introduzca los residuos en la ecuación de la desviación típica residual para resolver la fórmula.

Ejemplo de desviación estándar residual 

Comience por calcular los valores residuales. Por ejemplo, suponiendo que se tiene un conjunto de cuatro valores observados para un experimento sin nombre, la tabla siguiente muestra los valores y observados y registrados para determinados valores de x:

x

y

1

1

2

4

3

6

4

7

Si la ecuación lineal o la pendiente de la línea predicha por los datos en el modelo viene dada como yest = 1x + 2 donde yest y predicho, se puede encontrar el residuo de cada observación.

El residuo es igual a (y – yest), por lo que para el primer conjunto, el valor real de y es 1 y el predicho yest dado por la ecuación es yest = 1(1) + 2 = 3. El valor residual es, pues, 1 – 3 = -2, un valor residual negativo.

Para el segundo conjunto de puntos de datos x e y, el valor predicho de y cuando x es 2 e y es 4 puede calcularse como 1 (2) + 2 = 4.

En este caso, los valores reales y previstos son iguales, por lo que el valor residual será cero. Utilizaría el mismo proceso para llegar a los valores predichos para y en los dos conjuntos de datos restantes.

Una vez que hayas calculado los residuos de todos los puntos utilizando la tabla o un gráfico, utiliza la fórmula de la desviación estándar residual.

Ampliando la tabla anterior, se calcula la desviación típica residual:

 

x

 

y

yest

 

Residual (y-yest)

Suma de cada residuo al cuadrado, o Σ(y-yest)2 
 

1

 

1

 

3

 

-2

 

4

 

2

 

4

 

4

 

0

 

0

 

3

 

6

 

5

 

1

 

1

 

4

 

7

 

6

 

1

 

1

Obsérvese que la suma de los residuos al cuadrado = 6, que representa el numerador de la ecuación de la desviación típica de los residuos.

Para la parte inferior o denominador de la ecuación de la desviación estándar residual, n = el número de puntos de datos, que es 4 en este caso. Calcule el denominador de la ecuación como:

  • (Número de residuos – 2) = (4 – 2) = 2

Por último, calcula la raíz cuadrada de los resultados:

  • Desviación estándar residual: √(6/2) = √3 ≈ 1.732

La magnitud de un residuo típico puede darle una idea de lo cerca que están sus estimaciones. Cuanto más pequeña sea la desviación estándar residual, más cerca estará el ajuste de la estimación a los datos reales. En efecto, cuanto menor sea la desviación estándar residual en comparación con la desviación estándar de la muestra, más predictivo, o útil, es el modelo.

La desviación estándar residual puede calcularse cuando se ha realizado un análisis de regresión, así como un análisis de varianza (ANOVA). Al determinar un límite de cuantificación (LoQ), se permite el uso de una desviación estándar residual en lugar de la desviación estándar.

Dodaj komentarz