Últimas noticias
Vie. Nov 22nd, 2024

Juan QuiñonesLa estadística es una ciencia exacta. Sí, lo han leído bien. Aunque a algunos les pueda sorprender, la estadística, como las matemáticas, no falla nunca. La diferencia es que mientras las matemáticas responden a las cuestiones de forma concreta la estadística asigna probabilidades a los sucesos posibles. Por tanto, cualquier resultado es factible aunque no igualmente probable.

Algunos pensarán que esta es la respuesta que utilizaria un telepredicador para justificar su credo pero no lo es y les pongo un ejemplo. El valor de Google es de unos 390.000 millones de euros y buena parte del éxito de esta empresa está basado en el empleo de algoritmos predictivos basados en la estadística. En otras palabras, Google es la empresa del mundo que más y mejor usa la estadística para hacer negocios. Si la estadística fuese una patraña Google solo sería un buscador de páginas web más y no valdría ni la centésima parte de su valor.

¿Entonces por qué fallan las encuestas electorales? Muy sencillo, porque el razonamiento que lleva a pensar que a partir de los datos recogidos en un cuestionario se puede inferir el resultado electoral tiene el mismo fundamento que el que emplea alguien que es capaz de predecir el futuro leyendo las líneas de la mano.

Los modelos que aplican, las variables que utilizan las entidades que se dedican a realizar encuestas son secretos. Ni siquiera el CIS da pistas sobre cómo se «cocinan» las encuestas. Los que nos dedicamos al análisis estadístico de datos, lo que ahora llaman big data, daríamos un brazo por obtener un algoritmo fiable y darlo a conocer en una publicación científica. Sin embargo, las empresas demoscópicas cuentan en su poder con «fórmulas mágicas» que no muestran a nadie. Si el modelo del CIS fuese fiable, por poner un ejemplo, tendrían que acertar el resultado dentro del margen de error que ofrecen en esta página de al menos 49 de las 52 circunscripciones. ¿Apuestan algo a que no? Si no lo cumplen cualquier estadístico serio tiraría el modelo a la basura. ¿Apuestan algo a que tampoco?

Las encuestas electorales son un producto que tiene un precio muy alto pero que aportan muy poco valor. Son un entretenimiento más de las campañas electorales. Llenan páginas de periódicos, producen enfrentamientos entre líderes políticos que llenan páginas de periódicos y son el instrumento que usan los analistas políticos para llenar páginas de periódicos. Creo haberlo dejado claro. Los grandes beneficiados de este negocio son las empresas demoscópicas y la prensa. Nadie más.

¿Existen alternativas más fiables que las encuestas? Por supuesto que sí, pero son difícilmente aplicables en España. En Estados Unidos se han hecho muchos avances en la predicción de las elecciones presidenciales de 2008 y 2012 empleando modelos que utilizan datos de organismos oficiales y redes sociales. ¿Cuándo podremos avanzar en España en esta tecnología? Es complicado saberlo por dos motivos.

En primer lugar por la dificultad de acceso a datos oficiales en este país. Y para muestra un botón. Una de las primeras personas con las que comencé en el mundo del big data fue Roger Peng, del Departamento de Bioestadística de la Universidad Johns Hopkins de Baltimore. Uno de sus trabajos era relacionar episodios de crisis asmáticas con los niveles de contaminación ambiental. Claro que en Baltimore los datos de las estaciones ambientales son públicos y están disponibles en Internet sin ni siquiera tener que registrar tus datos, así como los datos del censo y tantos otros.

En segundo lugar porque no necesitan un trabajo de campo que es la parte costosa del mundo demoscópico. Es donde está el negocio. Para el cálculo posterior solo es necesario un técnico y un ordenador. No se puede cobrar lo mismo por sacar una legión de encuestadores a la calle que por darle a un botón y poner a un robot a recopilar datos de la red. Por tanto disfruten con las encuestas, sigan mirando el dedo y nos perderemos la belleza de la luna.

Related Post