domingo, 5 de febrero de 2017

PASOS PARA CALCULAR EL TAMAÑO DE UNA MUESTRA



Cuando realizamos un estudio de mercado para iniciar un negocio, muchas veces tenemos que utilizar la técnica de la encuesta, y para ello necesitamos calcular el tamaño de muestra que vamos a considerar. A continuación, te explicaré paso a paso cómo hacerlo de manera muy fácil.


Caso ejemplo

Para explicarte de manera práctica, utilizaremos el siguiente caso ejemplo. Supongamos que quiero hacer un estudio de mercado para incursionar en el negocio de regalos para personas entre 18 y 35 años de edad, hombres y mujeres, del nivel socio-económico B y C del distrito de San Borja en Lima, Perú. De acuerdo a las estadísticas, la población entre 18 y 35 años de edad perteneciente a los niveles socio-económicos B y C es de 32,084 personas.

Tengo que realizar encuestas a la población de San Borja que tengan dichas características y para ello debo calcular el tamaño de muestra a considerar en el estudio.


Conceptos básicos

Definición de población

Una población es el conjunto de personas que tienen características similares. Por ejemplo la población entre 18 y 35 años de edad perteneciente a los niveles socio-económicos B y C del distrito de San Borja en Lima, Perú.

El tamaño de la población es la cantidad total de personas que comprende el universo que se estudiará.

En nuestro caso el tamaño de la población es de 32,084 personas.

Definición de muestra y tamaño de muestra

Una muestra es un subconjunto o una parte de la población, que se obtiene para averiguar las propiedades o características de esta última. Por ello es importante que sea representativa de la población.

El tamaño de muestra es la cantidad de personas que se estudiarán. En nuestro caso, es la cantidad de personas a las cuales se aplicarán los cuestionarios de encuesta.

En muchos casos, el tamaño de la población es demasiado grande que sería imposible analizar a cada persona individualmente, y por ello se trabaja con muestras. Para nuestro caso ejemplo, imagina si tendríamos que aplicar encuestas a las 32,084 personas. Sería casi imposible o si se realizara el costo sería demasiado elevado y no sería conveniente financieramente. Por ello es que necesitamos trabajar con una muestra y debemos calcular el tamaño de muestra.

Es necesario tener presente que un tamaño de muestra demasiado grande representa un desperdicio de recursos, tanto materiales como humanos. Un tamaño demasiado pequeño es un desperdicio de esfuerzo, pues los resultados que se obtengan del estudio no tendrán un efecto significativo o se tendrán menos probabilidades de hacerlo.



¿De qué depende el tamaño de muestra?


El tamaño de la muestra dependerá de decisiones estadísticas y no estadísticas que tome el investigador.

a)    Decisiones estadísticas

El tamaño de muestra dependerá del grado de precisión y confiabilidad que queremos tener en los resultados. A mayor grado de confiabilidad y precisión mayor será el tamaño de muestra.

b)    Decisiones no estadísticas

En este caso se pueden considerar la disponibilidad de los recursos, el presupuesto o el equipo de personas que hará el trabajo de campo. Si los recursos son limitados, o el equipo de encuestadores no es óptimo,  es probable que el tamaño de muestra sea menor al deseado. Ten presente que un encuestador capacitado tiene un costo más elevado que aquel que no tiene suficiente preparación y experiencia.


 Factores estadísticos que afectan el tamaño de muestra


Los factores que intervienen en el tamaño de la muestra son:

a) El error máximo admisible

Es el que determina la precisión de los resultados. Es la máxima diferencia que podemos tolerar entre el valor de la variable obtenido en la muestra y el verdadero valor de ésta en la población. Para establecer el valor del error máximo admisible debemos preguntarnos cuán precisos deseamos que sean los resultados de la investigación.

Por ejemplo, para nuestra tienda de regalos, la investigación tiene por objetivo conocer el ticket promedio de compra en una tienda de regalos, y considera un error máximo admisible del 5%. Si en el estudio se obtiene que el ticket promedio es de S/. 100 por persona, estaríamos aceptando que realmente el verdadero valor esté entre 100 ± 5, es decir entre S/. 100 + 5% y S/. 100 - 5%, lo que da un intervalo de entre S/. 95 y S/. 105.

El error máximo admisible está relacionado inversamente con el tamaño de la muestra. A mayor error, el tamaño de muestra será más pequeño, y a menor error el tamaño de muestra será más grande.

Las empresas encuestadoras de renombre en el Perú utilizan un margen de error del 5%. Sin embargo, si se utiliza un margen de error del 10% los resultados también podrían ser significativos.


b) Coeficiente de confianza de la estimación

Para hacer la afirmación anterior sobre los límites dentro de los cuales se encuentra el verdadero valor poblacional, debe conocerse la probabilidad de que estos resultados sean ciertos y esto lo da el coeficiente o nivel de confianza, el cual es la medida probabilística de que el intervalo fijado con el error máximo admisible, contenga el valor poblacional.

En el ejemplo anterior, del ticket promedio de compra de regalos, se decidió trabajar con un nivel de confianza de 90%, con lo cual podríamos afirmar con un 90% de certeza que el ticket promedio de compra está entre S/. 95 y S/. 105. Claro está, queda 10% de posibilidades de equivocarnos al establecer esa conclusión. Si trabajamos con 95% de confianza, nos quedaría una posibilidad de equivocarnos de 5%.

A mayor nivel de confianza, más elevado será el tamaño de muestra, y al contrario, a menor nivel de confianza, el tamaño de muestra también será menor.

En general, los niveles de confianza más usuales son: 90%; 95% y 99%. En Perú las grandes empresas encuestadoras trabajan con un nivel de confianza del 95% y muchos investigadores trabajan con 90% de confianza.

Es necesario señalar que el nivel de confianza da lugar a un coeficiente denominado coeficiente Z, el mismo que es utilizado en las fórmulas para calcular el tamaño de muestra. Cada nivel de confianza es representado por el valor correspondiente del coeficiente Z, tal como sigue:



c) Varianza de la población (pq)

Recordemos el significado de los símbolos:

p = Es la probabilidad de éxito o proporción esperada. (Las personas responden Si.)
q = Es la probabilidad de fracaso o proporción de repuestas en la otra categoría. (Las personas responden No.).

La varianza en los ítems dicotómicos (dos respuestas que se excluyen mutuamente) es igual a pq y la varianza mayor (la mayor diversidad de respuestas) se da cuando p = q = 0.50 (la mitad de las personas responde sí y la otra mitad responde no).

Como se desconoce la varianza de la población, ponemos la varianza mayor posible porque a mayor varianza hará falta una muestra mayor. Es decir, consideramos los valores de p=q=0.50.


Pasos para calcular el tamaño de muestra


Paso 1. Definir la fórmula a utilizar

Dependiendo de la población, si es finita o infinita, se utilizará la fórmula correspondiente, tal como sigue:

a)   Fórmula para población finita o conocida

La fórmula para calcular el tamaño de muestra cuando el tamaño de la población es finita,  es la siguiente:

En donde,

n: Tamaño de muestra que queremos calcular
N: Tamaño de la población
Z: Coeficiente de confianza para un nivel de confianza determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible

b)   Para población infinita o desconocida

La fórmula para calcular el tamaño de muestra cuando el tamaño de la población se desconoce o es infinita, es la siguiente:
En donde

Z: Coeficiente de confianza para un nivel de confianza determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible


Paso 2: Cuantificar las variables a utilizar

Para el caso del ejemplo aplicativo, la población es finita, por lo tanto utilizaremos la primera fórmula. Las variables cuantificadas son las siguientes:

N: Tamaño de la población. La población es de 32,084 personas.
Z: Coeficiente de confianza. Para un nivel de confianza del 90%, el valor de Z = 1.645
p: Probabilidad de éxito. Consideramos el máximo: 0.50
q: Probabilidad de fracaso. Será 1.00 - 0.50 = 0.50
d: Error máximo admisible. Consideramos el 5%


Paso 3: Aplicar la fórmula

Aplicando la fórmula de tamaño de muestra para poblaciones finitas, obtenemos:



  n = 268

Por lo tanto, el tamaño de muestra es de 268 personas. Es decir realizaremos encuestas a 268 personas.