Definición de bondad de ajuste

Qué es la bondad de ajuste?

El término bondad de ajuste se refiere a una prueba estadística que determina si los datos de la muestra se ajustan a una distribución de una población con una distribución normal. En pocas palabras, plantea la hipótesis de si una muestra está sesgada o representa los datos que se esperarían encontrar en la población real. La bondad de ajuste establece la discrepancia entre los valores observados y los esperados del modelo en un caso de distribución normal. Existen múltiples métodos para determinar la bondad de ajuste, incluido el chi-cuadrado.

Puntos clave a tener en cuenta

  • La bondad de ajuste es una prueba estadística que trata de determinar si un conjunto de valores observados coincide con los esperados según el modelo aplicable.
  • Pueden mostrarle si los datos de su muestra se ajustan a un conjunto esperado de datos de una población con distribución normal.
  • Existen múltiples tipos de pruebas de bondad de ajuste, pero la más común es la prueba de chi-cuadrado.
  • La prueba de chi-cuadrado determina si existe una relación entre los datos categóricos.
  • La prueba de Kolmogorov-Smirnov determina si una muestra procede de una distribución específica de una población.

Comprender la bondad de ajuste

Las pruebas de bondad de ajuste son métodos estadísticos que hacen inferencias sobre los valores observados. Por ejemplo, puede determinar si un grupo de muestra es realmente representativo de toda la población. Como tales, determinan cómo se relacionan los valores reales con los valores predichos en un modelo. Cuando se utilizan en la toma de decisiones, las pruebas de bondad de ajuste facilitan la predicción de tendencias y patrones en el futuro.

Como se ha indicado anteriormente, existen varios tipos de pruebas de bondad de ajuste. Incluyen la prueba de chi-cuadrado, que es la más común, así como la prueba de Kolmogorov-Smirnov, y la prueba de Shipiro-Wilk. Las pruebas se realizan normalmente con programas informáticos. Pero los estadísticos pueden realizar estas pruebas utilizando fórmulas adaptadas al tipo de prueba específico.

Para realizar la prueba, se necesita una determinada variable, junto con una suposición de cómo se distribuye. También necesita un conjunto de datos con valores claros y explícitos, como el:

  • Los valores observados, que se derivan del conjunto de datos reales
  • Los valores esperados, que se obtienen a partir de las suposiciones realizadas
  • El número total de categorías del conjunto

Las pruebas de bondad de ajuste suelen utilizarse para comprobar la normalidad de los residuos o para determinar si dos muestras proceden de distribuciones idénticas.

Consideraciones especiales

Para interpretar una prueba de bondad de ajuste, es importante que los estadísticos establezcan un nivel alfa, como el valor p de la prueba de chi-cuadrado. El valor p se refiere a la probabilidad de obtener resultados cercanos a los extremos de los resultados observados. Esto supone que la hipótesis nula es correcta. Una hipótesis nula afirma que no existe ninguna relación entre las variables, y la hipótesis alternativa asume que existe una relación.

En su lugar, se mide la frecuencia de los valores observados y, posteriormente, se utiliza con los valores esperados y los grados de libertad para calcular el chi-cuadrado. Si el resultado es inferior a alfa, la hipótesis nula es inválida, lo que indica que existe una relación entre las variables.

Tipos de pruebas de bondad de ajuste

Prueba de chi-cuadrado

χ 2 = i = 1 k ( O i E i ) 2 / E i \chi^2=\sum\limits^k_{i=1}(O_i-E_i)^2/E_i χ2=i=1∑k(Oi-Ei)2/Ei

La prueba de chi-cuadrado, que también se conoce como prueba de chi-cuadrado para la independencia, es un método de estadística inferencial que pone a prueba la validez de una afirmación hecha sobre una población basada en una muestra aleatoria.

Se utiliza exclusivamente para datos separados en clases (bins) y requiere un tamaño de muestra suficiente para producir resultados precisos. Pero no indica el tipo o la intensidad de la relación. Por ejemplo, no concluye si la relación es positiva o negativa.

Para calcular la bondad de ajuste chi-cuadrado, establezca el nivel de significación alfa deseado. Por tanto, si su nivel de confianza es del 95% (o 0.95), entonces el alfa es .05. A continuación, identifica las variables categóricas que se van a probar y, después, define declaraciones de hipótesis sobre las relaciones entre ellas.

Las variables deben ser mutuamente excluyentes para poder realizar la prueba de independencia de chi-cuadrado. Y la prueba de bondad de ajuste de chi no debe utilizarse para datos que sean continuos.

Prueba de Kolmogorov-Smirnov

D = max

1 i N ( F ( Y i ) i 1 N , i N F ( Y i ) ) D=\max\limits_{1\leq i\leq N}\bigg(F(Y_i)-\frac{i-1}{N},\frac{i}{N}-F(Y_i)\bigg) D=1≤i≤Nmax(F(Yi)-Ni-1,Ni-F(Yi))

La prueba Kolmogorov-Smirnov (también conocida como prueba K-S), que debe su nombre a los matemáticos rusos Andrey Kolmogorov y Nikolai Smirnov, es un método estadístico que determina si una muestra pertenece a una distribución específica dentro de una población.

Esta prueba, que se recomienda para muestras grandes (e.g., más de 2000), es no paramétrica. Esto significa que no depende de ninguna distribución para ser válida. El objetivo es demostrar la hipótesis nula, que es la muestra de la distribución normal.

Al igual que el chi-cuadrado, utiliza una hipótesis nula y otra alternativa y un nivel de significación alfa. La nula indica que los datos siguen una distribución específica dentro de la población, y la alternativa indica que los datos no siguen una distribución específica dentro de la población. El alfa se utiliza para determinar el valor crítico utilizado en la prueba. Pero a diferencia de la prueba de chi-cuadrado, la prueba de Kolmogorov-Smirnov se aplica a las distribuciones continuas.

El estadístico de prueba calculado se suele denominar D. Determina si se acepta o se rechaza la hipótesis nula. Si D es mayor que el valor crítico alfa, se rechaza la hipótesis nula. Si D es menor que el valor crítico, se acepta la hipótesis nula, lo que indica que

Prueba de Shipiro-Wilk

W = ( i = 1 n a i ( x ( i ) ) 2 i = 1 n ( x i x ˉ ) 2 , W=\frac{\big(\sum^n_{i=1}a_i(x_{(i)}\big)^2}{\sum^n_{i=1}(x_i-\bar{x})^2}, W=∑i=1n(xi-xˉ)2(∑i=1nai(x(i))2,

La prueba de Shipiro-Wilk determina si una muestra sigue una distribución normal. La prueba sólo comprueba la normalidad cuando se utiliza una muestra con una variable de datos continuos y se recomienda para muestras pequeñas de hasta 2000.

La prueba de Shipiro-Wilk utiliza un gráfico de probabilidad llamado QQ Plot, que muestra dos conjuntos de cuantiles en el eje Y, ordenados de menor a mayor. Si cada cuantil procede de la misma distribución, la serie de gráficos es lineal.

El gráfico QQ se utiliza para estimar la varianza. Utilizando la varianza de la parcela QQ junto con la varianza estimada de la población, se puede determinar si la muestra pertenece a una distribución normal. Si el cociente de ambas varianzas es igual o cercano a 1, se puede aceptar la hipótesis nula. Si es considerablemente inferior a 1, se puede rechazar.

Al igual que las pruebas mencionadas anteriormente, ésta utiliza alfa y forma dos hipótesis: nula y alternativa. La hipótesis nula afirma que la muestra procede de la distribución normal, mientras que la hipótesis alternativa afirma que la muestra no procede de la distribución normal.

Ejemplo de bondad de ajuste

He aquí un ejemplo hipotético para mostrar cómo funciona la prueba de bondad de ajuste.

Supongamos que un pequeño gimnasio comunitario opera bajo el supuesto de que la mayor asistencia se produce los lunes, martes y sábados, la asistencia media los miércoles y jueves, y la menor asistencia los viernes y domingos. Partiendo de estos supuestos, el gimnasio emplea cada día a un determinado número de miembros del personal para registrar a los socios, limpiar las instalaciones, ofrecer servicios de entrenamiento e impartir clases.

Pero el gimnasio no está funcionando bien desde el punto de vista financiero y el propietario quiere saber si estos supuestos de asistencia y niveles de personal son correctos. El propietario decide contar el número de asistentes al gimnasio cada día durante seis semanas. A continuación, pueden comparar la asistencia supuesta del gimnasio con la asistencia observada mediante una prueba de bondad de ajuste de chi-cuadrado, por ejemplo.

Ahora que tienen los nuevos datos, pueden determinar cómo gestionar mejor el gimnasio y mejorar la rentabilidad.

¿Qué significa la bondad de ajuste??

La bondad de ajuste es una prueba estadística de hipótesis que se utiliza para comprobar la exactitud de los datos observados con respecto a los esperados. Las pruebas de bondad de ajuste pueden ayudar a determinar si una muestra sigue una distribución normal, si las variables categóricas están relacionadas o si las muestras aleatorias proceden de la misma distribución.

¿Por qué es importante la bondad de ajuste??

Las pruebas de bondad de ajuste ayudan a determinar si los datos observados coinciden con lo esperado. Las decisiones pueden tomarse en función del resultado de la prueba de hipótesis realizada. Por ejemplo, un minorista quiere saber qué oferta de productos atrae a los jóvenes. El minorista encuesta a una muestra aleatoria de personas mayores y jóvenes para identificar qué producto es el preferido. Utilizando el chi-cuadrado, identifican que, con un 95% de confianza, existe una relación entre el producto A y los jóvenes. A partir de estos resultados, se puede determinar que esta muestra representa a la población de adultos jóvenes. Los comerciantes minoristas pueden utilizarlo para reformar sus campañas.

Qué es la bondad de ajuste en la prueba Chi-cuadrado?

La prueba de chi-cuadrado permite comprobar si existen relaciones entre variables categóricas y si la muestra es representativa del conjunto. Estima el grado de coincidencia entre los datos observados y los datos esperados, es decir, el grado de ajuste.

Cómo se realiza la prueba de bondad de ajuste?

La prueba de bondad de ajuste consta de diferentes métodos de prueba. El objetivo de la prueba ayudará a determinar qué método utilizar. Por ejemplo, si el objetivo es comprobar la normalidad en una muestra relativamente pequeña, la prueba de Shipiro-Wilk puede ser adecuada. Si se quiere determinar si una muestra procede de una distribución específica dentro de una población, se utilizará la prueba de Kolmogorov-Smirnov. Cada prueba utiliza su propia fórmula. Sin embargo, tienen puntos en común, como la hipótesis nula y el nivel de significación.

El resultado final

Las pruebas de bondad de ajuste determinan en qué medida los datos de la muestra se ajustan a lo que se espera de una población. A partir de los datos de la muestra, se recoge un valor observado y se compara con el valor esperado calculado mediante una medida de discrepancia. Existen diferentes pruebas de hipótesis de bondad de ajuste en función del resultado que se busque.

La elección de la prueba de bondad de ajuste adecuada depende en gran medida de lo que se quiera saber sobre una muestra y del tamaño de la misma. Por ejemplo, si quiere saber si los valores observados de los datos categóricos coinciden con los valores esperados de los datos categóricos, utilice la prueba de chi-cuadrado. Si se quiere saber si una muestra pequeña sigue una distribución normal, la prueba de Shipiro-Wilk puede ser ventajosa. Hay muchas pruebas disponibles para determinar la bondad de ajuste.

Dodaj komentarz