Definición del estadístico chi-cuadrado (χ2)

¿Qué es un estadístico chi-cuadrado??

Un chi-cuadrado (χ2) la estadística es una prueba que mide cómo se compara un modelo con los datos reales observados. Los datos utilizados en el cálculo de un estadístico chi-cuadrado deben ser aleatorios, brutos, mutuamente excluyentes, extraídos de variables independientes y extraídos de una muestra suficientemente grande. Por ejemplo, los resultados de lanzar una moneda justa cumplen estos criterios.

Las pruebas de chi-cuadrado se utilizan a menudo en las pruebas de hipótesis. El estadístico chi-cuadrado compara el tamaño de cualquier discrepancia entre los resultados esperados y los resultados reales, dado el tamaño de la muestra y el número de variables en la relación.

Para estas pruebas, se utilizan los grados de libertad para determinar si se puede rechazar una determinada hipótesis nula en función del número total de variables y muestras del experimento. Como en cualquier estadística, cuanto mayor sea el tamaño de la muestra, más fiables serán los resultados.

Puntos clave

  • Un chi-cuadrado (χ2) el estadístico es una medida de la diferencia entre las frecuencias observadas y las esperadas de los resultados de un conjunto de eventos o variables.
  • La chi-cuadrado es útil para analizar esas diferencias en variables categóricas, especialmente las de carácter nominal.
  • χ2 depende del tamaño de la diferencia entre los valores reales y los observados, los grados de libertad y el tamaño de las muestras.
  • χ2 puede utilizarse para comprobar si dos variables están relacionadas o son independientes entre sí.
  • También puede utilizarse para comprobar la bondad de ajuste entre una distribución observada y una distribución teórica de frecuencias.

La fórmula de la chi-cuadrado es

χ c 2 = ( O i E i ) 2 E i donde: c = Grados de libertad O = Valor(es) observado(s) \N – Inicio {alineado}&\chi^2_c = \sum \frac{(O_i – E_i)^2}{E_i} \frac&| donde:}\\\\Nse&c=\texto{{de los grados de libertad}{de los grados de libertad}&O=texto{Valor(es) observado(s)}\N&E=texto{valor(es) esperado(s)}end{alineado} χc2=∑Ei(Oi-Ei)2donde:c=Grados de libertadO=Valor(es) observado(s)

¿Qué le dice una estadística chi-cuadrado??

Hay dos tipos principales de pruebas de chi-cuadrado: la prueba de independencia, que plantea una pregunta de relación, como por ejemplo: „¿Existe una relación entre el sexo del estudiante y la elección del curso?”?”El análisis chi-cuadrado se aplica a las variables y muestras de un experimento?”

El análisis chi-cuadrado se aplica a las variables categóricas y es especialmente útil cuando esas variables son nominales (donde el orden no importa, como el estado civil o el género).

Independencia

Al considerar el sexo del estudiante y la elección del curso, a χPodrían utilizarse 2 pruebas de independencia. Para realizar esta prueba, el investigador recogería datos sobre las dos variables elegidas (sexo y cursos elegidos) y luego compararía las frecuencias con las que los estudiantes masculinos y femeninos seleccionan entre las clases ofrecidas utilizando la fórmula dada anteriormente y una χ2 tabla estadística.

Si no hay relación entre el sexo y la selección de cursos (es decir, si son independientes), entonces se espera que las frecuencias reales con las que los estudiantes masculinos y femeninos seleccionan cada curso ofrecido sean aproximadamente iguales, o a la inversa, la proporción de estudiantes masculinos y femeninos en cualquier curso seleccionado debería ser aproximadamente igual a la proporción de estudiantes masculinos y femeninos en la muestra.

A χ2 La prueba de independencia puede indicarnos la probabilidad de que el azar explique cualquier diferencia observada entre las frecuencias reales de los datos y estas expectativas teóricas.

Bondad de ajuste

χ2 proporciona una forma de comprobar hasta qué punto una muestra de datos se ajusta a las características (conocidas o supuestas) de la población más amplia que la muestra pretende representar. Esto se conoce como bondad de ajuste. Si los datos de la muestra no se ajustan a las propiedades esperadas de la población que nos interesa, entonces no querremos utilizar esta muestra para sacar conclusiones sobre la población más amplia.

Ejemplo:

Por ejemplo, consideremos una moneda imaginaria con una probabilidad exacta del 50/50 de salir cara o cruz y una moneda real que se lanza 100 veces. Si esta moneda es justa, también tendrá la misma probabilidad de caer en cualquiera de las dos caras, y el resultado esperado de lanzar la moneda 100 veces es que saldrá cara 50 veces y cruz 50 veces.

En este caso, χLa prueba de chi-cuadrado puede decirnos cómo se comparan los resultados reales de 100 lanzamientos de moneda con el modelo teórico de que una moneda justa dará resultados de 50/50. El resultado del sorteo podría ser 50/50, 60/40 o incluso 90/10. Cuanto más se alejen los resultados reales de los 100 lanzamientos del 50/50, menos se ajustará este conjunto de lanzamientos a la expectativa teórica del 50/50, y más probable será que concluyamos que esta moneda no es realmente una moneda justa.

Cuándo utilizar una prueba chi-cuadrado

Una prueba de chi-cuadrado se utiliza para ayudar a determinar si los resultados observados se ajustan a los resultados esperados, y para descartar que las observaciones se deban al azar. Una prueba de chi-cuadrado es apropiada para esto cuando los datos que se analizan provienen de una muestra aleatoria, y cuando la variable en cuestión es una variable categórica. Una variable categórica es aquella que consta de selecciones como el tipo de coche, la raza, el nivel de estudios, el sexo masculino o el sexo femenino. mujer, cuánto le gusta a alguien un candidato político (de mucho a muy poco), etc.

Este tipo de datos suele recogerse mediante respuestas a encuestas o cuestionarios. Por lo tanto, el análisis de chi-cuadrado suele ser muy útil para analizar este tipo de datos.

Para qué se utiliza una prueba de chi-cuadrado?

El chi-cuadrado es una prueba estadística que se utiliza para examinar las diferencias entre las variables categóricas de una muestra aleatoria con el fin de juzgar la bondad de ajuste entre los resultados esperados y los observados. 

Quién utiliza el análisis chi-cuadrado?

Dado que la prueba de chi-cuadrado se aplica a las variables categóricas, es la más utilizada por los investigadores que estudian los datos de respuesta de las encuestas. Este tipo de investigación puede abarcar desde la demografía hasta la investigación sobre consumo y marketing, pasando por la ciencia política y la economía.

El análisis chi-cuadrado se utiliza cuando la variable independiente es nominal u ordinal?

Una variable nominal es una variable categórica que difiere por calidad, pero cuyo orden numérico podría ser irrelevante. Por ejemplo, si se pregunta a alguien por su color favorito, se obtiene una variable nominal. Preguntar la edad de alguien, por otro lado, produciría un conjunto de datos ordinales. El chi-cuadrado se aplica mejor a los datos nominales.

Dodaj komentarz