Antes de hablar de márgenes de error, necesitamos hablar de sesgos. En una investigación, un sesgo es una desviación entre nuestros resultados y el número real que queremos medir. Un ejemplo: Si queremos estimar la edad promedio de la población, es posible sacar una muestra en la cual el sesgo sería la diferencia entre la edad de todas las personas y la que se puede calcular en la fracción de este universo que logramos recopilar.
En cualquier estudio de opinión pública hay dos tipos de errores o sesgos. Los que podemos medir, cuantificar, o sea los “buenos”, y los que no tenemos idea de cómo afectan el resultado, o sea “los malos”. De estos últimos trata el siguiente artículo.
El más conocido de los sesgos “buenos” (medibles) es el margen de error. Es ese número usualmente puesto en porcentajes en la introducción o el cierre de las encuestas políticas. Para conocer más de este indicador misterioso vamos a intentar definir de qué se trata, para qué sirve, cómo se interpreta y qué condiciones tienen que darse para que sea válido.
¿Qué es el margen de error?
El margen de error también es conocido como error muestral. En palabras sencillas es qué tanto pueden variar mis resultados con respecto a los de la población total, solamente debido al hecho de que tomé una muestra. Es una variación estadística, medible, conocida y que está asociada a cualquier investigación que conlleve una muestra.
Cuando hacemos un censo (encuesta de todos los individuos) el margen de error es cero. Cada vez que seleccionamos una parte de esta población para medir algo, el margen de error entra en acción.
¿Para qué sirve?
Es una medida de precisión de la investigación. Funciona para ayudar en la toma de decisiones. Esta medida tiene mucha relación con el tamaño de la muestra. Entre más grande es la muestra, menor será el margen de error.
En una investigación, el proceso suele ser el siguiente: primero entiendo cuál es el problema que quiero resolver con mis datos. Con base en este objetivo, defino ¿cuál es el margen de error aceptable que puedo tener para tomar decisiones con esta información? Este porcentaje me deriva un tamaño de muestra ideal para realizar el estudio.
Obviamente hay tantos tipos de investigaciones como problemas a resolver. Es necesario emplear márgenes de error menores en estudios muy delicados (como temas médicos o farmacológicos), mientras que en medición de opiniones es posible ser un poco más flexible con respecto a la precisión que se maneja.
El hermano gemelo
El margen de error tiene un hermano gemelo del cual escuchamos hablar poco. El nivel de confianza. Este es un indicador general de ¿en qué porcentaje de los casos, las afirmaciones que decimos serán ciertas? Al igual que en el caso anterior, el nivel de confianza lo define el investigador de forma previa y este número guía el tamaño muestral que necesitamos.
¿Cómo se interpreta?
Partiremos de un estudio ficticio con un margen de error de un 3% y un nivel de confianza del 95%. Ambos indicadores fueron definidos con anterioridad para tener una idea de cuántas encuestas individuales eran necesarias para tener esa precisión.
Ahora necesitamos un resultado de la encuesta. Digamos que el estudio anterior nos dice que al 45% de las personas les gusta la pizza con piña. Manos a la obra. Con base en estos números, esta sería la interpretación correcta:
Como el estudio tiene un margen de error de un 3%, el indicador del agrado de la piña en la pizza NO ES 45% EXACTO. En realidad, es un intervalo que va desde 42% hasta 48%. Ese es el número real que nos dijo el estudio. Lamento decepcionarlos. Todos los números que alguna vez vieron en una “carrera de caballos” de una elección no eran reales. La forma correcta de verlos es un rango, no un número.
Y este rango de 42% a 48% tiene un 95% de probabilidades de ser correcto. Y un 5% de probabilidades de ser totalmente distinto debido a un error de selección estadístico.
¿Cuáles supuestos hay detrás?
Acá está el secreto. Para poder hacer afirmaciones como la anterior, hay algunos supuestos que deben cumplirse. Y estos supuestos no se dan en muchos casos.
- Para hablar de margen de error, la muestra debe ser aleatoria. El primer gran problema. Obtener una muestra aleatoria de casi cualquier población es bastante difícil. Y aún pequeños detalles (como por ejemplo medir en puntos de alto tránsito vs. medir en casas) ya hacen que el concepto deje de tener validez estadística.
- El margen de error hace referencia únicamente a la población de estudio de la cual se tomó la muestra. Si un estudio es telefónico, sólo vamos a representar a las personas con teléfono. Si una página de Facebook hace un sondeo, a lo sumo podremos tener una idea de qué piensan algunas de las personas que visitan ese sitio. Y al no ser una encuesta aleatoria, no es posible medir nada.
- Varía cada vez que uno cambia de población. Cada vez que divido mi muestra en partes o grupos o segmentos, el margen de error aumenta a lo interno de estos grupos. Por ejemplo, si hago un estudio para la población nacional y reporto el dato de mujeres y hombres por separado, este dato tendrá un margen de error mayor a la población total.
El cálculo de los márgenes de error es delicado de interpretar. Pero, tal y como veremos en la siguiente entrega, este es el menor de los males porque es medible. Y tal y como dicta la sabiduría popular, en el caso de las encuestas es preferible un “viejo conocido” que “un nuevo por desconocer” como ocurre con todos los otros sesgos no medibles de una investigación.