Su asesor de inversiones le propone un plan de inversión de renta mensual que promete una rentabilidad variable cada mes. Sólo se invertirá en él si se asegura un ingreso medio de 180 dólares mensuales. Su asesor también le dice que, durante los últimos 300 meses, el plan tuvo unos rendimientos de inversión con un valor medio de 190 dólares y una desviación estándar de 75 dólares. ¿Debería invertir en este plan?? La comprobación de hipótesis es una ayuda para la toma de decisiones.
Puntos clave
- La comprobación de hipótesis es una herramienta matemática para confirmar una afirmación o idea financiera o empresarial.
- Las pruebas de hipótesis son útiles para los inversores que tratan de decidir en qué invertir y si es probable que el instrumento proporcione un rendimiento satisfactorio.
- A pesar de la existencia de diferentes metodologías de comprobación de hipótesis, se utilizan los mismos cuatro pasos: definir la hipótesis, establecer el criterio, calcular el estadístico y llegar a una conclusión.
- Este modelo matemático, como la mayoría de las herramientas y modelos estadísticos, tiene limitaciones y es propenso a ciertos errores, por lo que los inversores deben considerar también otros modelos junto con éste
¿Qué es la prueba de hipótesis??
La prueba de hipótesis o de significación es un modelo matemático para probar una afirmación, idea o hipótesis sobre un parámetro de interés en un conjunto de población dado, utilizando datos medidos en un conjunto de muestra. Los cálculos se realizan sobre muestras seleccionadas para obtener información más decisiva sobre las características de toda la población, lo que permite poner a prueba de forma sistemática afirmaciones o ideas sobre todo el conjunto de datos.
He aquí un ejemplo sencillo: El director de un colegio informa de que los alumnos de su centro obtienen una media de 7 sobre 10 en los exámenes. Para probar esta „hipótesis”, registramos las notas de, por ejemplo, 30 estudiantes (muestra) de toda la población de estudiantes del centro (digamos 300) y calculamos la media de esa muestra. A continuación, podemos comparar la media de la muestra (calculada) con la media de la población (declarada) e intentar confirmar la hipótesis.
Por poner otro ejemplo, la rentabilidad anual de un fondo de inversión concreto es del 8%. Supongamos que el fondo de inversión existe desde hace 20 años. Tomamos una muestra aleatoria de los rendimientos anuales del fondo de inversión durante, por ejemplo, cinco años (muestra) y calculamos su media. A continuación, comparamos la media de la muestra (calculada) con la media de la población (declarada) para verificar la hipótesis.
Este artículo asume que los lectores están familiarizados con los conceptos de una tabla de distribución normal, la fórmula, el valor p y los fundamentos relacionados con la estadística.
Existen diferentes metodologías para la comprobación de hipótesis, pero se siguen los mismos cuatro pasos básicos:
Paso 1: Definir la hipótesis
Normalmente, el valor declarado (o la estadística de la afirmación) se establece como hipótesis y se presume que es verdadera. Para los ejemplos anteriores, la hipótesis será:
- Ejemplo A: Los alumnos de la escuela obtienen una media de 7 sobre 10 en los exámenes.
- Ejemplo B: El rendimiento anual del fondo de inversión es del 8% anual.
Esta descripción declarada constituye la „Hipótesis nula (H0)„y es se supone que sea cierto: el modo en que se presume que un acusado en un juicio con jurado es inocente hasta que se demuestre su culpabilidad mediante las pruebas presentadas en el tribunal. Del mismo modo, la comprobación de hipótesis comienza con el planteamiento y la asunción de una „hipótesis nula” y, a continuación, el proceso determina si es probable que la asunción sea verdadera o falsa.
El punto importante a tener en cuenta es que estamos probando la hipótesis nula porque hay un elemento de duda sobre su validez. Cualquier información que esté en contra de la hipótesis nula planteada se recoge en el Hipótesis alternativa (H1). Para los ejemplos anteriores, la hipótesis alternativa será:
- Los estudiantes puntúan una media que es no igual a 7.
- La rentabilidad anual del fondo de inversión es no igual al 8% anual.
En otras palabras, la hipótesis alternativa es una contradicción directa de la hipótesis nula.
Como en un juicio, el jurado asume la inocencia del acusado (hipótesis nula). El fiscal tiene que demostrar lo contrario (hipótesis alternativa). Del mismo modo, el investigador tiene que demostrar que la hipótesis nula es verdadera o falsa. Si el fiscal no consigue demostrar la hipótesis alternativa, el jurado tiene que dejar libre al acusado (basándose en la hipótesis nula). Del mismo modo, si el investigador no consigue demostrar una hipótesis alternativa (o simplemente no hace nada), entonces se asume que la hipótesis nula es verdadera.
Los criterios de decisión deben basarse en determinados parámetros de los conjuntos de datos.
Paso 2: Establecer los criterios
Los criterios de decisión deben basarse en determinados parámetros de los conjuntos de datos y aquí es donde entra en juego la conexión con la distribución normal.
Según el postulado estadístico estándar sobre la distribución muestral, „Para cualquier tamaño de muestra n, la distribución muestral de X̅ es normal si la población X de la que se extrae la muestra se distribuye normalmente.”Por lo tanto, las probabilidades de todas las demás medias muestrales posibles que se podría seleccionar están distribuidos normalmente.
Para e.g., determinar si la rentabilidad media diaria, de cualquier acción cotizada en el mercado de valores XYZ, en torno al día de Año Nuevo es superior al 2%.
H0: Hipótesis nula: media = 2%
H1: Hipótesis alternativa: media > 2% (esto es lo que queremos probar)
Tomar la muestra (digamos de 50 acciones de un total de 500) y calcular la media de la muestra.
Para una distribución normal, el 95% de los valores se encuentran dentro de dos desviaciones estándar de la media de la población. Por lo tanto, esta distribución normal y la hipótesis del límite central para el conjunto de datos de la muestra nos permite establecer el 5% como nivel de significación. Tiene sentido ya que, bajo esta hipótesis, hay menos de un 5% de probabilidad (100-95) de obtener valores atípicos que estén más allá de dos desviaciones estándar de la media de la población. Dependiendo de la naturaleza de los conjuntos de datos, pueden tomarse otros niveles de significación al 1%, 5% o 10%. Para los cálculos financieros (incluidas las finanzas del comportamiento), el 5% es el límite generalmente aceptado. Si encontramos algún cálculo que supere las dos desviaciones típicas habituales, entonces tenemos un caso fuerte de valores atípicos para rechazar la hipótesis nula.
Gráficamente, se representa como sigue:
En el ejemplo anterior, si la media de la muestra es mucho mayor que el 2% (digamos 3.5%), entonces rechazamos la hipótesis nula. La hipótesis alternativa (media >2%) se acepta, lo que confirma que la rentabilidad media diaria de las acciones es efectivamente superior al 2%.
Sin embargo, si no es probable que la media de la muestra sea significativamente superior al 2% (y se mantiene, por ejemplo, en torno al 2.2%), entonces NO podemos rechazar la hipótesis nula. El reto es cómo decidir en casos tan cercanos. Para llegar a una conclusión a partir de las muestras y los resultados seleccionados, hay que determinar un nivel de significación que permita concluir la hipótesis nula. La hipótesis alternativa permite establecer el nivel de significación o el concepto de "valor crítico” para decidir sobre los casos tan cercanos.
Según la definición estándar de los libros de texto, „un valor crítico es un valor de corte que define los límites a partir de los cuales se puede obtener menos del 5% de las medias muestrales si la hipótesis nula es verdadera. Las medias muestrales obtenidas más allá de un valor crítico darán lugar a la decisión de rechazar la hipótesis nula.” En el ejemplo anterior, si hemos definido el valor crítico como 2.1%, y la media calculada llega a 2.2%, entonces rechazamos la hipótesis nula. Un valor crítico establece una demarcación clara sobre la aceptación o el rechazo.
Paso 3: Calcular la estadística
Este paso implica el cálculo de la(s) cifra(s) necesaria(s), conocida(s) como estadística(s) de prueba (como la media, la puntuación z, el valor p, etc.).), para la muestra seleccionada. (Lo veremos en una sección posterior).)
Paso 4: Llegar a una conclusión
Con el valor o los valores calculados, decida la hipótesis nula. Si la probabilidad de obtener una media muestral es inferior al 5%, entonces la conclusión es rechazar la hipótesis nula. En caso contrario, aceptar y mantener la hipótesis nula.
Tipos de errores
Puede haber cuatro resultados posibles en la toma de decisiones basada en la muestra, con respecto a la aplicabilidad correcta a toda la población:
Decisión de retener |
Decisión de rechazo |
|
Se aplica a toda la población |
Correcto |
Incorrecto (Error de tipo 1 – a) |
No se aplica a toda la población |
Incorrecto (Error de tipo 2 – b) |
Correcto |
Los casos „correctos” son aquellos en los que las decisiones tomadas sobre las muestras son realmente aplicables a toda la población. Los casos de error surgen cuando se decide mantener (o rechazar) la hipótesis nula basándose en los cálculos de la muestra, pero esa decisión no se aplica realmente a toda la población. Estos casos constituyen errores de tipo 1 (alfa) y de tipo 2 (beta), como se indica en la tabla anterior.
La selección del valor crítico correcto permite eliminar los errores de tipo 1 alfa o limitarlos a un rango aceptable.
Alpha denota el error en el nivel de significación y lo determina el investigador. Para mantener el nivel de significación o confianza estándar del 5% para los cálculos de probabilidad, se mantiene en el 5%.
De acuerdo con los puntos de referencia y las definiciones aplicables para la toma de decisiones:
- „Este criterio (alfa) suele fijarse en 0.05 (a = 0.05), y comparamos el nivel alfa con el valor p. Cuando la probabilidad de un error de tipo I es inferior al 5% (p < 0.05), decidimos rechazar la hipótesis nula; en caso contrario, mantenemos la hipótesis nula.”
- El término técnico utilizado para esta probabilidad es el Valor p. Se define como „la probabilidad de obtener un resultado muestral, dado que el valor indicado en la hipótesis nula es verdadero. El valor p para obtener un resultado muestral se compara con el nivel de significación.”
- Un error de tipo II, o error beta, se define como la probabilidad de retener incorrectamente la hipótesis nula, cuando en realidad no es aplicable a toda la población.
Unos cuantos ejemplos más demostrarán este y otros cálculos.
Ejemplo 1
Existe un plan de inversión de renta mensual que promete rendimientos mensuales variables. Un inversor invertirá en ella sólo si se le asegura un ingreso medio de 180 dólares mensuales. El inversor dispone de una muestra de 300 meses de rentabilidad que tiene una media de 190 dólares y una desviación estándar de 75 dólares. ¿Deberían invertir en este plan??
Planteemos el problema. El inversor invertirá en el plan si se le asegura la rentabilidad media deseada de 180 dólares.
H0: Hipótesis nula: media = 180
H1: Hipótesis alternativa: media > 180
Método 1: Enfoque del valor crítico
Identificamos un valor crítico XL para la media de la muestra, que es lo suficientemente grande como para rechazar la hipótesis nula – i.e. rechazar la hipótesis nula si la media de la muestra >= valor crítico XL
P (identificar un error alfa de tipo I) = P(rechazar H0 dado que H0 es verdadera),
Se alcanzaría cuando la media muestral supera los límites críticos.
= P (dado que H0 es verdadera) = alfa
Gráficamente, aparece como sigue:
Tomando alfa = 0.05 (i.e. Nivel de significación del 5%), Z0.05 = 1.645 (a partir de la tabla Z o de la tabla de distribución normal)
= > XL = 180 +1.645*(75/sqrt(300)) = 187.12
Dado que la media muestral (190) es mayor que el valor crítico (187.12), se rechaza la hipótesis nula y se concluye que el rendimiento mensual medio es efectivamente superior a 180 dólares, por lo que el inversor puede considerar la posibilidad de invertir en este plan.
Método 2: Uso de estadísticas de prueba estandarizadas
También se puede utilizar el valor estandarizado z.
Estadística de prueba, Z = (media de la muestra – media de la población) / (desviación estándar / sqrt (no. de muestras).
Entonces, la región de rechazo pasa a ser la siguiente
Z= (190 – 180) / (75 / sqrt (300)) = 2.309
Nuestra región de rechazo al nivel de significación del 5% es Z> Z0.05 = 1.645.
Dado que Z= 2.309 es mayor que 1.645, se puede rechazar la hipótesis nula con una conclusión similar a la mencionada anteriormente.
Método 3: Cálculo del valor P
Nuestro objetivo es identificar P (media muestral >= 190, cuando la media = 180).
= P (Z >= (190- 180) / (75 / sqrt (300))
= P (Z >= 2.309) = 0.0084 = 0.84%
La siguiente tabla para inferir los cálculos del valor p concluye que se confirma que la rentabilidad media mensual es superior a 180:
Valor p |
Inferencia |
menor que el 1% |
Pruebas confirmadas apoyando la hipótesis alternativa |
entre el 1% y el 5% |
Pruebas sólidas apoyando la hipótesis alternativa |
entre el 5% y el 10% |
Pruebas débiles apoyando la hipótesis alternativa |
mayor que el 10% |
No hay pruebas apoyando la hipótesis alternativa |
Ejemplo 2
Un nuevo agente de bolsa (XYZ) afirma que sus comisiones de corretaje son inferiores a las de su actual agente de bolsa (ABC). Los datos disponibles de una empresa de investigación independiente indican que la media y la desviación estándar de todos los clientes del corredor ABC son 18 y 6 dólares, respectivamente.
Se toma una muestra de 100 clientes de ABC y se calculan los gastos de intermediación con las nuevas tarifas del broker XYZ. Si la media de la muestra es de 18 dólares.75 y el desvío estándar es el mismo (6 $), ¿se puede hacer alguna inferencia sobre la diferencia en la factura media de los corredores ABC y XYZ??
H0: Hipótesis nula: media = 18
H1: Hipótesis alternativa: media <> 18 (Esto es lo que queremos probar.)
Región de rechazo: Z <= – Z2.5 y Z>=Z2.5 (suponiendo un nivel de significación del 5%, dividido en 2.5 de cada lado).
Z = (media de la muestra – media) / (desviación estándar / sqrt (no. de las muestras))
= (18.75 – 18) / (6/(sqrt(100)) = 1.25
Este valor Z calculado se encuentra entre los dos límites definidos por:
– Z2.5 = -1.96 y Z2.5 = 1.96.
Esto concluye que no hay pruebas suficientes para inferir que hay alguna diferencia entre las tarifas de su actual corredor y el nuevo corredor.
Alternativamente, el valor p = P(Z< -1.25)+P(Z >1.25)
= 2 * 0.1056 = 0.2112 = 21.12% que es mayor que 0.05 o 5%, lo que lleva a la misma conclusión.
Gráficamente, se representa de la siguiente manera:
Puntos de crítica para el método de prueba hipotético:
- Un método estadístico basado en suposiciones
- Propenso a errores como se detalla en términos de errores alfa y beta
- La interpretación del valor p puede ser ambigua y llevar a resultados confusos
El resultado final
La comprobación de hipótesis permite que un modelo matemático valide una afirmación o idea con un determinado nivel de confianza. Sin embargo, como la mayoría de las herramientas y modelos estadísticos, tiene algunas limitaciones. El uso de este modelo para la toma de decisiones financieras debe considerarse con ojo crítico, teniendo en cuenta todas las dependencias. También vale la pena explorar métodos alternativos como la inferencia bayesiana para un análisis similar.
Fuentes del artículo
Nuestro equipo exige a los escritores que utilicen fuentes primarias para apoyar su trabajo. Entre ellas se encuentran los libros blancos, los datos gubernamentales, los informes originales y las entrevistas con expertos del sector. También hacemos referencia a investigaciones originales de otras editoriales de renombre cuando es necesario. Puede obtener más información sobre las normas que seguimos para producir contenidos precisos e imparciales en nuestro
política editorial.