Qué es una muestra?
Una muestra se refiere a una versión más pequeña y manejable de un grupo mayor. Es un subconjunto que contiene las características de una población mayor. Las muestras se utilizan en las pruebas estadísticas cuando el tamaño de la población es demasiado grande para que la prueba incluya a todos los miembros u observaciones posibles. Una muestra debe representar a la población en su conjunto y no reflejar ningún sesgo hacia un atributo específico.
Existen varias técnicas de muestreo utilizadas por los investigadores y estadísticos, cada una con sus propias ventajas e inconvenientes.
Puntos clave
- En estadística, una muestra es un subconjunto analítico de una población mayor.
- El uso de muestras permite a los investigadores llevar a cabo sus estudios con datos más manejables y de forma oportuna.
- Las muestras extraídas al azar no tienen mucho sesgo si son lo suficientemente grandes, pero conseguir una muestra de este tipo puede ser caro y llevar mucho tiempo.
- En el muestreo aleatorio simple, cada entidad de la población es idéntica, mientras que el muestreo aleatorio estratificado divide la población total en grupos más pequeños.
Comprender las muestras
Una muestra es un número insesgado de observaciones tomadas de una población. En términos sencillos, una población es el número total de observaciones (i.e., individuos, animales, artículos, datos, etc.) contenida en un grupo o contexto determinado. Una muestra, en otras palabras, es una porción, parte o fracción de todo el grupo, y actúa como un subconjunto de la población. Las muestras se utilizan en diversos entornos en los que se lleva a cabo la investigación. Los científicos, los vendedores, las agencias gubernamentales, los economistas y los grupos de investigación son algunos de los que utilizan muestras para sus estudios y mediciones.
El uso de poblaciones enteras para la investigación conlleva desafíos. Los investigadores pueden tener problemas para acceder a poblaciones enteras. Y, debido a la naturaleza de algunos estudios, los investigadores pueden tener dificultades para obtener los resultados que necesitan a tiempo. Por eso se utilizan muestras de personas. El uso de un número menor de personas que representen a toda la población puede seguir produciendo resultados válidos al tiempo que se reduce el tiempo y los recursos.
Las muestras utilizadas por los investigadores deben parecerse a la población en general para poder hacer inferencias o predicciones precisas. Todos los participantes de la muestra deben compartir las mismas características y cualidades. Por lo tanto, si el estudio se refiere a los estudiantes universitarios de primer año, la muestra debe ser un pequeño porcentaje de varones que se ajusten a esta descripción. Del mismo modo, si un grupo de investigación realiza un estudio sobre los patrones de sueño de las mujeres solteras de más de 50 años, la muestra debe incluir sólo a mujeres de este grupo demográfico.
Consideraciones especiales
Pensemos en un equipo de investigadores académicos que quiere saber cuántos estudiantes estudiaron menos de 40 horas para el examen CFA y aun así aprobaron. Dado que más de 200.000 personas realizan el examen en todo el mundo cada año, llegar a todos y cada uno de los participantes en el examen consumiría tiempo y recursos.
De hecho, cuando se hayan recogido y analizado los datos de la población, habrán pasado un par de años, por lo que el análisis carecerá de valor, ya que habrá surgido una nueva población. Lo que los investigadores pueden hacer en su lugar es tomar una muestra de la población y obtener datos de esta muestra.
Para conseguir una muestra no sesgada, la selección debe ser aleatoria, de modo que todos los miembros de la población tengan la misma probabilidad de formar parte del grupo de la muestra. Esto es similar a un sorteo de lotería y es la base del muestreo aleatorio simple.
Para que la muestra sea insesgada, la selección debe ser aleatoria, de modo que todos los miembros de la población tengan las mismas posibilidades de formar parte del grupo.
Tipos de muestreo
Muestreo aleatorio simple
El muestreo aleatorio simple es ideal si todas las entidades de la población son idénticas. Si a los investigadores no les importa si los sujetos de la muestra son todos hombres o todas mujeres o una combinación de ambos sexos de alguna forma, el muestreo aleatorio simple puede ser una buena técnica de selección.
Supongamos que en 2016 se presentaron al examen CFA 200.000 personas, de las cuales el 40% eran mujeres y el 60% hombres. Por lo tanto, la muestra aleatoria extraída de la población debe tener 400 mujeres y 600 hombres para un total de 1.000 examinados.
Pero qué pasa con los casos en los que es importante conocer la proporción de hombres y mujeres que han aprobado un examen tras estudiar menos de 40 horas? En este caso, sería preferible una muestra aleatoria estratificada a una muestra aleatoria simple.
Muestreo aleatorio estratificado
Este tipo de muestreo, también denominado muestreo aleatorio proporcional o muestreo aleatorio por cuotas, divide la población global en grupos más pequeños. Se denominan estratos. Las personas de los estratos comparten características similares.
¿Y si la edad fuera un factor importante que los investigadores quisieran incluir en sus datos?? Utilizando la técnica de muestreo aleatorio estratificado, podrían crear capas o estratos para cada grupo de edad. La selección de cada estrato tendría que ser aleatoria para que todas las personas del grupo tengan una probabilidad de ser incluidas en la muestra. Por ejemplo, dos participantes, Alex y David, tienen 22 y 24 años, respectivamente. La selección de la muestra no puede elegir a uno sobre otro basándose en algún mecanismo preferente. Ambos deberían tener la misma probabilidad de ser seleccionados de su grupo de edad. Los estratos podrían ser algo así
Estrato (edad) | Número de personas en la población | Número a incluir en la muestra |
---|---|---|
20-24 | 30,000 | 150 |
25-29 | 70,000 | 350 |
30-34 | 40,000 | 200 |
35-39 | 30,000 | 150 |
40-44 | 20,000 | 100 |
>44 | 10,000 | 50 |
Total | 200,000 | 1,000 |
A partir de la tabla, la población se ha dividido en grupos de edad. Por ejemplo, 30.000 personas dentro del rango de edad de 20 a 24 años realizaron el examen CFA en 2016. Utilizando esta misma proporción, el grupo de la muestra tendrá (30.000 ÷ 200.000) x 1.000 = 150 examinados que entran en este grupo. Alex o David -o ambos o ninguno- pueden ser incluidos entre los 150 participantes en el examen aleatorio de la muestra.
Hay muchos más estratos que podrían recopilarse a la hora de decidir el tamaño de la muestra. Algunos investigadores podrían poblar las funciones laborales, los países, el estado civil, etc. de los examinados al decidir cómo crear la muestra.
Ejemplos de muestras
En 2017, la población del mundo era de 7.5 mil millones, de los cuales 49.El 6% eran mujeres y el 50.El 4% eran hombres. El número total de personas en un país determinado también puede ser un tamaño de población. El número total de estudiantes de una ciudad puede tomarse como población, y el número total de perros de una ciudad es también un tamaño de población. Se pueden tomar muestras de estas poblaciones con fines de investigación.
Siguiendo con nuestro ejemplo del examen CFA, los investigadores podrían tomar una muestra de 1.000 participantes en el CFA del total de 200.000 examinados -la población- y analizar los datos necesarios sobre este número. La media de esta muestra se tomaría para estimar la media de examinados del CFA que aprobaron aunque sólo estudiaron menos de 40 horas.
El grupo de muestra tomado no debe estar sesgado. Esto significa que si la media de la muestra de los 1.000 participantes en el examen CFA es de 50, la media de la población de los 200.000 examinados también debería ser aproximadamente de 50.
Preguntas frecuentes
¿Por qué los analistas utilizan muestras en lugar de medir la población??
A menudo, una población es demasiado grande o extensa para medir a cada miembro y medir a cada miembro sería caro y llevaría mucho tiempo. Una muestra permite hacer inferencias sobre la población utilizando métodos estadísticos.
Qué es una muestra aleatoria simple?
Este método de muestreo utiliza encuestados o puntos de datos que se seleccionan aleatoriamente de la población más amplia. Con un tamaño de muestra suficientemente grande, una muestra aleatoria elimina el sesgo.
Por qué las muestras aleatorias permiten la inferencia?
Las leyes de la estadística implican que se pueden realizar mediciones y evaluaciones precisas sobre una población utilizando una muestra. El análisis de la varianza (ANOVA), la regresión lineal y las técnicas de modelización más avanzadas son válidas debido a la ley de los grandes números y al teorema del límite central.
¿Qué tamaño de muestra se necesita??
Esto dependerá del tamaño de la población y del tipo de análisis que se quiera hacer (e.g., qué intervalos de confianza se están utilizando). El análisis de potencia es una técnica para evaluar matemáticamente el menor tamaño de muestra necesario en función de sus necesidades. Otra regla general es que la muestra debe ser lo suficientemente grande, pero no más del 10% de la población.