top of page
Buscar
Foto del escritorJoseph & Lucy Cole

De primeras a segundas vueltas: Una predicción a manera de ensayo

Actualizado: 29 jul 2019

Por Joseph y Lucy Cole

"Winwood Reade is good upon the subject," said Holmes. "He remarks that, while the individual man is an insoluble puzzle, in the aggregate he becomes a mathematical certainty. You can, for example, never foretell what any one man will do, but you can say with precision what an average number will be up to. Individuals vary, but percentages remain constant. So says the statistician." 


- Sir Arthur Conan Doyle, “The Sign of the Four” (1890)


 

A dos semanas de la segunda vuelta, ya abundan en Guatemala los comentarios y predicciones acerca del posible resultado. Unos creen en las encuestas, otros observan las tendencias en redes sociales, otros confían en lo que los expertos escriben en los periódicos, y un gran número simplemente expresan lo que les dice su propia intuición. Nosotros también queremos opinar, pero basando nuestra conclusión en algo más digno de la cuarta revolución industrial. Vamos a buscar la data histórica de las elecciones pasadas, y con ayuda de la computadora, torturar los números hasta que nos revelen el futuro.


La predicción

“Let the jury consider their verdict,” the King said, for about the twentieth time that day.

“No, no!” said the Queen. “Sentence first— verdict afterwards.”

“Stuff and nonsense !” said Alice loudly. “The idea of having the sentence first !”


- Lewis Carroll, “Alice’s Adventures in Wonderland” (1865)


 

He aquí nuestra flamante predicción:


¿Cómo llegamos a esto?


Primera Observación


La figura 1 compara el desempeño de la UNE en la segunda vuelta de la elección pasada con su desempeño en primera vuelta, a nivel departamental.

[Click en la imagen para verla más grande]


Ante semejante belleza de diagrama de dispersión, la tentación es grande para:

  1. Calcular la ecuación que describe la recta que mejor se ajusta a los datos.

  2. Sustituir los votos de la UNE en primera vuelta de la elección actual en la ecuación calculada en el paso (1), para obtener pronósticos del voto de la UNE en segunda vuelta en cada departamento.

  3. Totalizar los pronósticos obtenidos en el paso (2) y usar el resultado como nuestro pronóstico para el voto de la UNE en segunda vuelta.

Si contáramos con una gráfica equivalente para el partido VAMOS, haríamos lo mismo para predecir sus votos. Y ya con esas 2 predicciones en mano, proclamaríamos al nuevo presidente del país. El problema es que el partido VAMOS nunca ha estado en una segunda vuelta. Pero no importa. Seguiremos una estrategia indirecta, estimando sus votos por diferencia. A continuación explicamos cómo.


Cálculo de votos VAMOS


Primero, necesitamos obtener valores numéricos para las siguientes variables:


UNE: Votos de la UNE en Segunda Vuelta


ABSTENCIÓN: Definida como la diferencia entre el número de votos emitidos en Primera Vuelta y el número de votos emitidos en Segunda Vuelta. OJO: No confundir esto con el abstencionismo relativo al padrón electoral. Esa es una variable interesante por sí misma, y quizá sea importante en otros esquemas, pero no en este. Aquí definimos abstención como la caída de votos entre primera y segunda vuelta.


BLANCO_O_NULO: Votos en blanco o nulos en Segunda Vuelta.


Además de las 3 anteriores, que serán estimadas, necesitamos la siguiente, que es conocida.


EMITIDOS_PRIMERA: Votos emitidos en Primera Vuelta.


Bueno, ya tenemos los ingredientes. La manera de combinarlos será:


VAMOS = EMITIDOS_PRIMERA - ABSTENCIÓN - UNE - BLANCO_NULO


(Estamos conscientes de que la ecuación no es una identidad, ni matemática ni "contablemente" hablando, pero creemos que puede servir.)


Estimación de las Variables


Las variables estimadas fueron calculadas corriendo regresiones con los datos de las elecciones anteriores. No entraremos en detalles técnicos, pero sí describiremos brevemente cuál fue la variable predictora usada en cada caso.


(Para que el lector técnico pueda saber exactamente qué hicimos, compartimos un archivo de Excel al final del artículo con todos los datos usados y cálculos realizados.)

UNE

La variable predictora de los votos de la UNE en segunda vuelta serán los votos obtenidos en primera (lo que la figura 1 nos pedía a gritos que hiciéramos).


ABSTENCIÓN

Se nos ocurre que una buena variable para predecir la ABSTENCIÓN es el número de votos obtenidos por los partidos que no pasaron a segunda vuelta; es decir los votantes “huérfanos”.


La figura 2 muestra la relación entre la ABSTENCIÓN y los votantes huérfanos en la elección pasada.

[Click en la imagen para verla más grande]


A simple vista, parece que la relación estaría razonablemente bien descrita por un modelo lineal, si no fuera por la incómoda presencia de dos valores atípicos. Estos corresponden a los departamentos de Huehuetenango y Guatemala. Surge la pregunta de si su comportamiento atípico se debió a circunstancias peculiares a la elección 2015, o si por sus naturalezas suelen desviarse de esa manera. Echemos un vistazo a la elección del 2011 y comparemos.

[Click en la imagen para verla más grande]


La elección del 2011 exhibe un patrón muy similar al de la elección del 2015, con los 2 valores atípicos correspondiendo a los mismos departamentos y con desviaciones en el mismo sentido: Huhuetenango con una abstención mayor a la del resto del país y Guatemala con una menor.


Parece ser, entonces, que las desviaciones reponden a características propias de esos departamentos. ¿Cuáles podrían ser? Sospechamos que el perfil de votante más común en Huehuetenango prefiere concentrar su atención en las autoridades locales; su interés disminuye en segunda vuelta, cuando ya lo único que queda por elegir es el presidente. Guatemala, en cambio, tiene una mayor proporción de votantes urbanos, con mayor nivel socioeconómico y educativo. Este perfil de votante le presta más atención a las elecciones presidenciales, resultando en un menor abstencionismo.


BLANCO_o_NULO

Para esta variable seguimos la misma lógica que para la ABSTENCIÓN, pero usando como variable predictiva el número de votos blancos o nulos emitidos en primera vuelta.


Sucede lo mismo que con la abstención, sólo que con un único valor atípico: Guatemala.

[Click en la imagen para verla más grande]


¿Por qué es Guatemala el valor atípico en este caso? Esto puede estar relacionado con su comportamiento en el abstencionismo. Quizá si los ciudadanos que votan blanco o nulo en Guatemala vivieran en otros departamentos, se abstendrían de votar. Otra razón puede ser que muchos votantes en Guatemala ven el sufragio como una forma de expresión. Votan nulo o en blanco para protestar contra las opciones electorales o contra todo el sistema.


Estabilidad de los Parámetros Estimados


La pregunta del millón (de votos) es si los parámetros de los modelos calculados son lo suficientemente estables; es decir, no varían mucho entre una elección y la siguiente. Si no lo fueran, no tendríamos ninguna razón para confiar en nuestra predicción.


Para el caso de la variable UNE, el parámetro importante es la pendiente de la recta trazada en la figura 1, que tiene un valor de 1.40. Este número se interpreta como un factor de crecimiento del voto de la UNE entre primera y segunda vuelta. El modelo predice que el voto de la UNE crece 40 % al pasar de primera vuelta a segunda, independientemente del departamento que sea.


¿Será razonable suponer, entonces, que el factor de crecimiento para esta elección será similar al 40% de la elección pasada? Lamentablemente no podemos comparar la elección del 2015 con la del 2011 porque UNE no participó en esa ocasión. Pero sí podemos observar lo que pasó en la elección del 2007. En aquella elección el voto de la UNE creció un 56%. Es notable que ese número no es mucho más alto que el 40% de la elección pasada, siendo que aquél fue el mejor momento en la historia del partido (ganaron la elección), y considerando que:


- Aún no habían sufrido el desgaste político de haber gobernado en el periodo 2008-2011.


- A juzgar por las encuestas de “anti-voto”, su candidato en el 2007 provocaba mucha menos aversión que la candidata actual.


Este año la UNE vuelve a competir con la misma candidata del 2015. Y este hecho, sumado a la discusión anterior, nos hace creer que su crecimiento en segunda vuelta no será muy diferente al 40% del 2015.


Notamos, también, que el crecimiento de la UNE en segundas vueltas siempre ha sido menor al de sus rivales (ver cuadro).


¡La UNE creció menos que su rival incluso cuando ganó! (Esto merece una reflexión adicional, que elaboraremos en la siguiente sección.)


Para ABSTENCIÓN y BLANCO_O_NULO, los parámetros son también las pendientes de las rectas que mejor se ajustan a los puntos en los diagramas, pero adicionalmente debe hacerse un ajuste especial para "corregir" a los valores atípicos (es decir, hay que estimar por cuánto más o menos se desvían del resto).


Aquí la estabilidad nos preocupa mucho menos que en el caso de la UNE. Para estos parámetros sí contamos con información que nos permite calcular y comparar sus magnitudes en dos elecciones consecutivas; y como vimos, entre 2011 y 2015 no cambiaron mucho.


¿Por qué a la UNE le cuesta tanto crecer en segundas vueltas?


He said, “You see, Linda, till about forty years ago, everybody always voted. Say we wanted to decide who was to be the new President of the United States. The Democrats and Republicans would both nominate someone, and everybody would say who they wanted. When Election Day was over, they would count how many people wanted the Democrat and how many wanted the Republican. Whoever had more votes was elected. You see?”


Linda nodded and said, “How did all the people know who to vote for? Did Multivac tell them?”


Matthew’s eyebrows hunched down and he looked severe. “They just used their own judgment, girl.” She edged away from him, and he lowered his voice again, “I’m not angry at you, Linda. But, you see, sometimes it took all night to count what everyone said and people were impatient. So they invented special machines which could look at the first few votes and compare them with the votes from the same places in previous years. That way the machine could compute how the total vote would be and who would be elected. You see?”


She nodded. “Like Multivac.”


“The first computers were much smaller than Multivac. But the machines grew bigger and they could tell how the election would go from fewer and fewer votes. Then, at last, they built Multivac and it can tell from just one voter.”


Linda smiled at having reached a familiar part of the story and said, “That’s nice.”


-Isaac Asimov, “The Franchise” (1955)


 

Para contestar a esta pregunta, y a manera de darle un poco de soporte teórico a nuestra predicción, apelaremos al Teorema del Votante Mediano.


En este famoso modelo, una contienda electoral entre 2 candidatos se plantea como un juego estratégico.


Imaginemos que todos los votantes ocupan algún punto sobre un segmento de recta. La recta representa un espectro de valores a lo largo de alguna dimensión relevante, como por ejemplo ideología ("izquierda" o "derecha"), nivel socioeconómico ("rico" o "pobre"), etc. En el punto medio de la recta está el votante con las preferencias o características más equilibradas con respecto a esa dimensión, y en los extremos se ubican los más "extremistas" (o hasta "radicales", si se quiere.)


El juego consiste en que los candidatos deben escoger en qué punto de la recta colocarse. "Colocarse" en un determinado punto, en este contexto, significa concentrar su esfuerzo de campaña en apelar a los votantes con esas características. (Por ejemplo, si me coloco cerca del extremo izquierdo, estoy haciendo todo lo posible por ganar la simpatía de la gente de la extrema izquierda).


Una vez que cada candidato haya escogido su ubicación, los votantes eligen. Explicaremos cómo eligen los votantes con un ejemplo y un diagrama.


Supongamos que el candiato S decide ubicarse a la izquierda del votante medio y que el candidato G a la derecha. El candidato G ganará los votos de todos los votantes a la derecha de G, puesto que están más cerca de él que de su rival. Lo mismo pasará con todos los votantes a la izquierda de S; preferirán a S que a G porque S está más cercano. ¿Y qué harán los votantes entre los puntos S y G? Sencillamente, los que estén más cerca de G votarán por G y los que estén más cerca de S votarán por S.


Como vemos en la figura, en el ejemplo ganaría el candidato G. ¿Qué tendría que haber hecho S para ganar? Colocarse más cerca del votante medio. Pero G sabe que S tiene un incentivo para hacer eso, de manera que él también querrá estar lo más cerca posible del votante medio. Cual fuerza gravitacional, el votante medio atrae a los dos candidatos, provocando que ambos acaben exactamente en el mismo punto. Es más, una vez allí, ninguno querrá desviarse (situación conocida en teoría de juegos como un equilibrio de Nash.)


¿Explica este sencillo modelo los resultados en las segundas vueltas en Guatemala? Nosotros creemos que sí. La razón por la que a la UNE le va peor que a sus rivales en segunda vuelta es que, aunque trata de moverse hacia el votante medio, no lo consigue. En primera vuelta se coloca en un punto demasiado lejano del centro, pues seguramente ahí se concentra su "base". Pero en segunda vuelta necesita correrse hacia el centro. Sus rivales son más efectivos en seducir al votante medio.


¿Y si no le pegamos?


Tenemos razones empíricas y teóricas para confiar en nuestra predicción. Es más, ya que ninguno de los candidatos que nos convencían pasó a segunda vuelta, pudimos hacer un análisis desapasionado y con total honestidad intelectual.


Pero, por supuesto, detrás de cada número, hay un ser humano con voluntad, razón y pasión, así que el electorado como un todo bien podría comportarse de manera inesperada esta vez. Un motivo podría ser la desconfianza en el Tribunal Supremo Electoral derivada de los errrores cometidos en la primera vuelta. Otro podría ser la coyuntura, llena de tensiones por casos de corrupción, los tuits de Donald Trump, etc. De aquí al 11 de agosto cualquier cosa puede suceder.


Si no le pegamos, pues a seguir aprendiendo. Haremos un análisis post mortem, buscando las variables omitidas, refinando el modelo y tratando de hacerlo mejor la próxima vez.


Ahora, si sí le pegamos, quiere decir que una simple pareja de esposos, desde su comedor, sin más que un módico manejo de Excel y algunas horas de tiempo libre, es ya capaz de predecir una segunda vuelta electoral. La era del Multivac vaticinada por el gran Asimov, ¡está realmente muy cerca de ser realidad! Y para nosotros sería la joya de la corona de nuestra colección de momentos nerdos.


Notas para el lector técnico


En aras de la transparencia y de la replicabilidad, compartimos una hoja de Excel con todos los datos utilizados y los cálculos realizados. En ella, el lector técnico podrá ver exactamente las especificaciones de los modelos, así como examinar las erres cuadradas, errores estándar y demás cuestiones estadísticas. También podrá darse gusto haciendo su propio análisis de sensibilidad.



Un par de aclaraciones:


- Para el cálculo de la predicción, usamos los valores correspondientes a los límites superiores de los intervalos de 95% de confianza de los parámetros principales. Esto es porque sí estamos dispuetsos a creer que en esta elección terminen siendo un poco más grandes que sus valores esperados. Para el factor de crecimiento de la UNE, el valor de dicho límite es 1.48, que resulta ser un punto intermedio entre el 40% de la elección pasada y el 56% del 2007. Es decir, vamos a suponer que el crecimiento de la UNE será mayor esta vez, pero no tan alto como en el 2007. Hicimos lo mismo para ABSTENCIÓN Y BLANCO_O_NULO, pues también estamos dispuestos a conceder que las magnitudes sean un tanto mayor esta vez: Los problemas técnicos del Tribunal Supremo Electoral con el conteo de la primera vuelta posiblemente hayan desanimado a muchos votantes, algunos de los cuales decidirán abstenerse o votar nulo o blanco.


- Todas las variables fueron estimadas con regresiones lineales simples, por el origen, con el método de mínimos cuadrados ordinarios. Los valores atípicos fueron "tratados" mediante la inclusión de variables dummy; ingresadas en forma de interacción con la variable predictora.


- La regresión de la UNE se calculó con los datos de la elección 2015. Para las otras se combinaron las elecciones del 2011 y el 2015. Es decir, el modelo de UNE tiene 22 obsevaciones; los de ABSTENCIÓN Y BLANCO_O_NULO tienen 44 cada uno.


Fuentes y Referencias

Asimov, Isaac. “The Franchise”. 1955

Conan Doyle, Arthur. “The Sign of the Four”. 1890

Tribunal Supremo Electoral, Guatemala C.A. Elecciones Generales y Parlamento Centroamericano 2019

Tribunal Supremo Electoral, Guatemala C.A. Memoria Electoral 2011

Tribunal Supremo Electoral, Guatemala C.A. Memoria Electoral 2015

4000 visualizaciones2 comentarios

2 Comments


Douglas Gonzalez
Douglas Gonzalez
Aug 01, 2019

Les felicito por su trabajo. Tiene mucho sustento y sin duda alguna una aproximación a la realidad desde los datos. Algunos aportes que podrían serles de utilidad y que podrían tener un efecto no medible estadísticamente, entre los imponderables:

1. El péndulo. La votación en nuestro país ha sido pendular desde desde sus inicios hasta Otto Pérez (con una pausa por el golpe de Serrano): Venimos de una izquierda politiquera-populista-rural (Cerezo), hacia una derecha empresarial-conservadora-populista-urbana (Serano). Al modelo le sucedieron: Arzú-Portillo, Berger-Colom y con Pérez Molina toda estaba listo para un Baldizón izquierda-politiquera-clientelar-rural, lo cual habría perfeccionado el péndulo. ¿Qué rompió el péndulo?: CICIG! CICIG rompe el continuo y permite que un Jimmy Morales derecha-populista-conservadora-urbana, reciba el mandato después d…


Like

ALEXANDER EFRAIN ARAUZ SANDOVAL
ALEXANDER EFRAIN ARAUZ SANDOVAL
Jul 30, 2019

Excelente análisis, sucinto y a la vez aplicado; más allá de los resultados finales considero que es un excelente ejercicio que vale la pena tomarse el tiempo para reflexionar toda la teoría que existe detrás y cómo podemos apoyarnos de herramientas estadísticas hoy más que nunca, en un mundo donde lo que abunda es la data. Sin importar el ganador, felicito a los autores por arriesgarse a emitir un pronostico y sobretodo compartir ese conocimiento, es allí donde esta la verdadera riqueza

Like
bottom of page