El Instituto de Estadística (Iesta) de la Facultad de Ciencias Económicas y de Administración de la Universidad de la República hace seminarios todas las semanas, a los que eligieron llamar Siesta (casualmente, tienen lugar los martes a las 14.00). Allí, integrantes del instituto, de otras facultades e incluso de fuera de la universidad presentan sus trabajos y se generan intercambios sobre temas de investigación en el área.
El martes fue el turno de Juan José Goyeneche y Ana Coimbra, dos investigadores del Iesta que presentaron la metodología usada y la precisión alcanzada con la proyección de escrutinio en las elecciones del 27 de octubre, que fue desarrollada por varios investigadores en estadística, informáticos y la diaria, y transmitida por TV Ciudad.
Sobre la elección de la muestra y respecto de cómo 7.500 votos pueden adelantar las opciones de los casi tres millones que votaron el domingo 27 conversamos con Goyeneche y Coimbra.
El teorema de la sopa
Podría decirse que la vida de las proyecciones es muy corta. Comienza a las 19.30, cuando termina el horario de votación y se abren las urnas, y se apaga y deja de importar a la madrugada, cuando la Corte Electoral logra tener una proporción importante de circuitos escrutados. Pero a las 20.30, cuando se levanta la veda electoral, es fundamental.
La primera vez que Juan Goyeneche trabajó en proyecciones de escrutinio fue en las elecciones internas de 1982, en la radio CX30. Desde hace varios años, con los investigadores en estadística Natalia da Silva, Ana Coimbra, Ignacio Álvarez-Castro, Guillermo Zoppolo y Eugenia Ríaño viene trabajando en una metodología de muestreo que este año, sumada al trabajo del informático Jaime Vázquez y del equipo de la diaria, se aplicó para las elecciones nacionales.
Así, el domingo 27 de octubre 150 suscriptores de la diaria estuvieron en la apertura de urnas en circuitos de todo el país y, mediante una aplicación, transmitieron los datos de los primeros 50 votos escrutados en cada mesa. Esos 7.500 votos permitieron adelantar los resultados de la elección, con un margen de error máximo de 1,5%.
Goyeneche explica que para elegir la muestra, es decir, para elegir cuáles iban a ser esos 150 circuitos, se tomaron los resultados de la elección de 2014 y en función de esos datos se clasificaron los cerca de 6.000 circuitos donde votaban personas que ya habían votado; “la información de los circuitos de 2014 la metimos en los circuitos de 2019, por lo que, si la gente votase lo mismo, podrías determinar que tal partido debería sacar X votos”. Eso se hizo para los votos del Frente Amplio (FA) y para los votos de los partidos Nacional (PN) y (PC) juntos. Así se identifican dos estratos: un grupo de circuitos en el que los votos del FA serían mayoría y otro en el que los votos al PN y el PC serían mayoría, cada uno formado por 3.000 circuitos. Los 1.000 circuitos restantes corresponden a credenciales nuevas, de personas que las sacaron por primera vez o que la trasladaron, y conformaron el tercer estrato.
De estos tres grupos se eligieron, aleatoriamente, 50 circuitos: 50 circuitos considerados “frentistas”, 50 donde serían mayoría los partidos tradicionales y 50 de los circuitos nuevos. San Jacinto, Tarariras, Cardal, Rincón de Valentín, San José de Mayo, Artigas, Tacuarembó fueron algunos de los lugares de todo el país adonde fueron los suscriptores de la diaria para registrar esos primeros votos (ver mapa). La elección de los circuitos es aleatoria, y podría haber pasado que no hubiera circuitos de alguno de los 19 departamentos, pero la metodología funcionaría igual, aseguraron Goyeneche y Coimbra.
Según explicó Goyeneche, el margen de error fue de 1,5% para el resultado del voto a la reforma constitucional Vivir sin Miedo (la proyección fue de 46,3% y el resultado definitivo de votos a favor fue de 46,83%, según la Corte Electoral), de 1% para los partidos que alcanzaron alrededor de 10% de los votos y de 0,27% para los partidos que rondaron el 1% de los votos.
La metodología y el ingreso de la información fueron las claves para que el resultado fuera tan cercano a lo que arrojó el escrutinio definitivo. “Teníamos muy buenos voluntarios levantando la información, en forma correcta, rápida y fidedigna”, aseguraron los investigadores. Para explicar la lógica del muestreo, Goyeneche apela al “teorema de la sopa”. “Si hacés sopa en tu casa revolvés con una cucharita y probás que esté bien de sal. Pero para probar si está bien de sal una sopa para 100 boy scouts en un campamento no tomás la misma proporción. Tomás, a lo sumo, dos cucharitas. Es medio sorprendente, pero cuanto más grande es la población, más fácil sacás la muestra”, aseguró.
El 24 de noviembre la historia se repetirá. Los circuitos serán los mismos, y entre los investigadores todavía evalúan si, además de la información de 2014, utilizarán la del 27 de octubre. “En ese caso vamos a poder ver a dónde van los votos de octubre”, afirmaron.