Featured Post

Encuestas y Dados Cargados. (Rogelio Fernandez-Alonso)

 
Encuestas y Dados  Cargados
En medio de todo el revuelo de las encuestas presidenciales, escuché el otro día al presidente de la casa encuestadora GEA-ISA


completa:http://tinyurl.com/7hg7y7b . ¿El máximo ejecutivo de una casa encuestadora de “renombre” no sabe de estadística, o está tratando de justificar un engaño?
Y es que si la muestra fuera realmente aleatoria (véase mi nota anterior, Un Modelo Matemático para Encuestas Presidenciales http://bit.ly/yjFULi ), 1000 casos serían más que suficientes para sacar conclusiones muy precisas. Ciertamente dicha muestra es algo así como una cienmilésima parte de la población total que se quiere analizar, y en ese sentido Ricardo De la Peña se refiere a la muestra como pequeña. Pero ignora u omite el hecho de que 1000 casos son muchos comparados con las posibilidades de respuesta, que en este caso son 4 (tres candidatos, además de la posibilidad de no contestar).
Se trata de una situación análoga a los volados. Si una moneda no está cargada, la probabilidad de que al echar un volado caiga águila es 1. Esto significa que al repetir el volado cierto número de veces, aproximadamente la mitad de ellas, es decir el 50%, caerá águila. ¿Cuántas repeticiones serán necesarias para obtener este resultado? Ya que sólo hay dos posibilidades, diez repeticiones ya mostrarán esa tendencia: tal vez salgan 6 águilas y 4 soles, pero si salen 7 águilas y 3 soles, ya tendríamos derecho a sospechar que la moneda está cargada. Si el volado se repite 500 veces, la tendencia será más clara y más precisa.
En el caso de un dado, que tiene 6 caras, la probabilidad de que al echarlo salga uno de los números es 5. Si echamos el dado 1500 veces y hacemos una estadística de los resultados, cada número aparecerá aproximadamente 250 veces. Si se hacen más repeticiones, el cociente entre el número de veces que aparece el número específico y el número total de tiradas se acerca cada vez más a 5. Por supuesto, se asume que el dado no está cargado.
Matemáticamente, en un experimento que puede resultar en varios eventos, laprobabilidad de uno de estos eventos se define como el cociente m/n, donde m es el número de posibilidades de resultar el evento específico y n es el número total de posibles resultados en el experimento. En los dos ejemplos anteriores, 250mrepeticiones son suficientes para que la proporción de repeticiones que resultan en el evento, respecto al número total de repeticiones, se acerque al cociente m/n.
Una encuesta se puede ver como un experimento que puede tener 4 resultados (los tres candidatos y la no-respuesta). La probabilidad de cada evento es entonces el cociente m/n, donde m es el número de personas con la intención de votar por dicho evento y n es el número total de votantes. Una muestra sería un cierto número de repeticiones del experimento. Así pues 1000 = 250x4 personas encuestadas son suficientes para que las proporciones observadas en la muestra sean muy cercanas a las reales.
Así pues, la razón por la que las diversas encuestas no coinciden, no es por el tamaño de la muestra, ni es un “fenómeno estadístico”. La razón es en realidad, que las muestras no están bien diseñadas, por incompetencia o bien porque las encuestas están cargadas. Lo dicho por el presidente de GEA-ISA es ignorancia o engaño.
Rogelio Fernandez-Alonso - Contenidos EMET