Estadística no paramétrica: Visión general

Qué son las estadísticas no paramétricas?

La estadística no paramétrica se refiere a un método estadístico en el que se supone que los datos no provienen de modelos prescritos que están determinados por un pequeño número de parámetros; ejemplos de estos modelos son el modelo de distribución normal y el modelo de regresión lineal. La estadística no paramétrica a veces utiliza datos ordinales, lo que significa que no se basa en números, sino en una clasificación u orden. Por ejemplo, una encuesta que refleje las preferencias de los consumidores, que van de lo que les gusta a lo que no les gusta, se consideraría un dato ordinal.

La estadística no paramétrica incluye la estadística descriptiva no paramétrica, los modelos estadísticos, la inferencia y las pruebas estadísticas. La estructura del modelo de los modelos no paramétricos no se especifica a priori sino que se determina a partir de los datos. El término no paramétrico no quiere decir que estos modelos carezcan completamente de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano. Un histograma es un ejemplo de estimación no paramétrica de una distribución de probabilidad.

Puntos clave

  • La estadística no paramétrica es fácil de utilizar, pero no ofrece la precisión de otros modelos estadísticos.
  • Este tipo de análisis suele ser el más adecuado cuando se considera el orden de algo, ya que aunque los datos numéricos cambien, los resultados probablemente seguirán siendo los mismos.

Comprender la estadística no paramétrica

En estadística, la estadística paramétrica incluye parámetros como la media, la desviación estándar, la correlación de Pearson, la varianza, etc. Esta forma de estadística utiliza los datos observados para estimar los parámetros de la distribución. En la estadística paramétrica, se suele suponer que los datos proceden de una distribución normal con parámetros desconocidos μ (media de la población) y σ2 (varianza de la población), que luego se estiman utilizando la media y la varianza de la muestra.

La estadística no paramétrica no asume el tamaño de la muestra ni si los datos observados son cuantitativos.

La estadística no paramétrica no asume que los datos proceden de una distribución normal. En cambio, la forma de la distribución se estima en esta forma de medición estadística. Aunque hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que el verdadero proceso de generación de datos dista mucho de tener una distribución normal.

Ejemplos de estadísticas no paramétricas

En el primer ejemplo, consideremos un analista financiero que desea estimar el valor en riesgo (VaR) de una inversión. El analista recopila datos de ganancias de 100 inversiones similares en un horizonte temporal similar. En lugar de suponer que las ganancias siguen una distribución normal, utilizan el histograma para estimar la distribución de forma no paramétrica. El percentil 5 de este histograma proporciona al analista una estimación no paramétrica del VaR.

Para un segundo ejemplo, consideremos a otro investigador que quiere saber si el promedio de horas de sueño está relacionado con la frecuencia de las enfermedades. Dado que muchas personas se enferman rara vez, si es que lo hacen, y otras ocasionales se enferman mucho más a menudo que la mayoría de las demás, la distribución de la frecuencia de las enfermedades es claramente no normal, siendo sesgada a la derecha y con tendencia a los valores atípicos. Por lo tanto, en lugar de utilizar un método que asuma una distribución normal para la frecuencia de las enfermedades, como se hace en el análisis de regresión clásico, por ejemplo, el investigador decide utilizar un método no paramétrico como el análisis de regresión cuantílica.

Consideraciones especiales

Las estadísticas no paramétricas han ganado aprecio debido a su facilidad de uso. A medida que se alivia la necesidad de parámetros, los datos se vuelven más aplicables a una mayor variedad de pruebas. Este tipo de estadística puede utilizarse sin la media, el tamaño de la muestra, la desviación estándar o la estimación de cualquier otro parámetro relacionado cuando no se dispone de ninguna de esas informaciones.

Dado que la estadística no paramétrica hace menos suposiciones sobre los datos de la muestra, su aplicación es más amplia que la estadística paramétrica. En los casos en que las pruebas paramétricas son más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que las estadísticas no paramétricas descartan parte de la información disponible en los datos, a diferencia de las estadísticas paramétricas.

Dodaj komentarz