Se ha instado a los españoles a votar anticipadamente en las elecciones nacionales del próximo domingo. La votación terminó el lunes con predicciones mixtas. Algunos ven una mayoría clara para la derecha, otros dan una mayoría estrecha y algunos ven más un gobierno de izquierda. Dados estos datos y el error estándar de las encuestas, ¿cuáles son las probabilidades de cada evento? Esta es la pregunta que responde nuestro clásico modelo de elección probabilística, publicado por EL PAÍS desde 2016.
El siguiente gráfico muestra el ranking de lugares basado en el promedio de las encuestas. El conservador Partido Popular (PP) tendrá alrededor de 142 escaños, seguido del Partido Socialista (PSOE) con 108, el ultraderechista Vox con 35 y el de izquierda Sumer con 34. Otras fuerzas políticas tendrán 31 escaños. Asientos totales.
Para realizar esta estimación utilizamos un modelo estadístico y simulamos las elecciones 15.000 veces, como se explica en la metodología al final del artículo. El modelo se alimenta de encuestas e incluye un dato clave: su precisión histórica.
En España, las encuestas de opinión suelen desviarse de los resultados en una media de dos puntos por partido, y no es raro que algunas de ellas cometan errores de tres o más puntos. En otras palabras: nuestros rangos son amplios pero no caprichosos porque reflejan la precisión de las encuestas anteriores.
Es fácil ver que todavía hay incertidumbre en esta elección. Por ejemplo, según nuestros cálculos, la mayoría de los resultados de PP son 142 lugares, pero su rango de probabilidad del 90 % está entre 119 y 164 lugares. Todavía hay una posibilidad entre 20 de que el PP termine por encima (o por debajo) de ese gran rango.
Importante: Quién alcanzará la mayoría de edad
La principal ventaja de tener un modelo predictivo es que nos permite predecir probabilidades para diferentes resultados, lo que las encuestas por sí solas no pueden hacer. Esto hace posible abordar la pregunta fundamental de una elección general: ¿Qué partidos tienen más probabilidades de ganar los 176 escaños necesarios para la mayoría? El diagrama muestra el resumen:
- El 55% de las veces BB y Vox suman la mayoría. En 15.000 simulacros, esta es la frecuencia con la que ambos partidos alcanzan los 176 escaños deseados. La mayoría aislada de PP ocurre en solo 1 de cada 100 casos (1%). Otro 5% de los simulacros podría tener un gobierno del PP, con el apoyo de Vox en el referéndum de investidura, mientras que el partido también consigue el apoyo de Coalición Canaria, Unión del Pueblo Navarro y Teruel Existe.
- En otro 15% de simulacros (1 de cada 7) probablemente habrá una mayoría de izquierdas, apoyada por los mismos partidos que votaron o se abstuvieron del PSOE, parlamento tras las elecciones de 2019 cuando se confirme a Pedro Sánchez como nuevo presidente del Gobierno : BNG, PNV, ERC y Bild, además de Sumer. Entonces PSOE y Sumar solos tienen un 1% de probabilidad de conseguir la mayoría.
- En el 23% restante de las simulaciones, ninguna de las cantidades anteriores es posible. Casi siempre son situaciones en las que el PSOE necesita el apoyo de los partidos independentistas Junts, CUP o ambos para superar los 176 escaños (20% de las veces). Pero también se incluyen aquí los empates en 175 escaños entre ese grupo (PSOE, Sumar, BNG, PNV, ERC, Bildu, Junts y CUP) y PP, Vox, UPN, CC y Teruel Existe (3%).
¿Qué indican estos datos? Las cifras anteriores son probabilidades: las probabilidades de que ocurra cada mayoría. Dicen que la mayoría de BP y Vox son el resultado, aunque esto pasa la mitad de las veces. En cierto sentido, estos pronósticos son una advertencia contra posibles sorpresas. Otra forma de verlo es imaginar un árbol alternativo. Para cada uno de los 100 futuros posibles, los números de arriba indican cuántos gana la derecha y cuántos gana la izquierda. Nunca sabemos cuál de esos futuros será el nuestro.
15.000 simulaciones para cada partido
El siguiente gráfico muestra la distribución de escaños para cada partido en nuestras 15.000 simulaciones. Primero nos fijamos en los cuatro grandes. Aparte de señalar que la incertidumbre es considerable, llama la atención que las distribuciones no son simétricas por efecto del sistema electoral. A Sumer y Vox, por ejemplo, les resulta más fácil hacerse más pequeños que crecer. Al PSOE le está ocurriendo lo contrario, como si creciera lo suficiente como para amenazar la primera posición del PP en varias provincias.
Finalmente, estas son asignaciones de escaños para partidos más pequeños.
método
Las predicciones se realizan mediante un modelo estadístico basado en estudios y su precisión histórica. Este modelo es similar al modelo que usamos en las elecciones de abril y noviembre de 2019 En las elecciones autonómicas de México, Francia, Reino Unido y España, Andalucía, Cataluña o Madrid. Funciona en cuatro pasos: 1) agregar y promediar las encuestas, 2) proyectar el promedio de cada provincia, 3) incorporar la incertidumbre esperada y 4) simular 15.000 elecciones para asignar escaños y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta docenas de encuestas para mejorar su precisión. El promedio se pondera para dar diferentes ponderaciones a cada encuesta de acuerdo con tres factores: tamaño de la muestra, agencia de encuestas y fecha. Lea los detalles aquí.
Paso 2. Plan para votar por cada provincia. Antes de calcular los escaños, es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para ello, se utilizan algunos cambios en los resultados electorales de 2019 y en las encuestas provinciales. Este es un método simple y común que funciona razonablemente bien (la razón es que si un grupo crece, crecerá donde ya era fuerte). La mayor dificultad es encontrar números exactos con partidos muy pequeños que tienen preferencias de lugares, pero tenemos muy pocos datos.
Paso 3. Incorporación de la incertidumbre de la encuesta. Este es el paso más complejo e importante. Debe estimar la precisión esperada de las encuestas. ¿Qué tan grandes son los errores estándar? ¿Cuál es la probabilidad de errores en 2, 3 o 5 puntos? Para responder a estas preguntas se están analizando cientos de estudios en España y miles de estudios a nivel internacional.
Calibrar errores esperados. En primer lugar, se estima el error de las encuestas en España. Desde 1986 se ha creado la base de datos para todas las elecciones. El error absoluto medio (MAE) promedió 2 puntos por partido. Esto significa que las desviaciones de 3 o 4 puntos son comunes y el margen de error (95%) está más cerca de los siete puntos para los partidos con el 30% de los votos. Esos errores dependen al menos de dos cosas: el tamaño del partido y la cercanía de las elecciones. Para tener en cuenta estos dos factores, utilizamos la base de datos de Jennings y Vlesian publicada en Nature. Se analizaron los errores en más de 4100 encuestas de 241 elecciones en 19 países occidentales. Por tanto, se desarrolla un modelo sencillo que estima el error MAE del voto medio estimado por las encuestas para cada partido: 1) su tamaño (es más fácil estimar un partido con el 5% de los votos que un partido con más del 30% ), y 2) el número de días que faltan para la elección (a medida que mejoren las encuestas). ).
Elección del tipo de entrega. Se utiliza una distribución multivariada para incorporar la incertidumbre del voto de cada partido en cada simulación. Las distribuciones Student-t se usan en lugar de la normal, de modo que tienen colas largas (curtosis): esto hace que sea más probable que ocurran eventos más extremos. Nate Silver explicó los beneficios de esta hipótesis: “He estimado el grado de curtosis con la base de datos. Defino una matriz de covarianza de estas distribuciones para que la suma de votos no supere el 100% (idea de Chris Hanretty). La incertidumbre está ligada a 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores equivalentes al voto de un partido en toda España. Es importante hacerlo porque los errores en las encuestas son generalmente sistemáticos y los mismos en todos los territorios. Si suponemos que son independientes, los errores se anulan entre provincias y el modelo falla por exceso de confianza. Esto sucedió con algunas muestras de las elecciones estadounidenses en 2016. Un segundo componente de incertidumbre está adscrito a cada provincia. Finalmente, se debe medir la amplitud de las matrices de covarianza para que las distribuciones de votos resultantes tengan el MAE esperado y la desviación estándar de acuerdo con la calibración.
Paso 4. Simular. El último paso es ejecutar el modelo 15.000 veces. Cada iteración es una simulación de elecciones con porcentajes de votos que varían según la distribución definida en el paso anterior. Los resultados de estas simulaciones permiten calcular la probabilidad de que cada partido gane un determinado número de escaños, alcance la mayoría, salga ganando, etc.
¿Por qué estudios? Este modelo está completamente basado en la investigación. Existe la percepción de que las encuestas no son confiables, pero la verdad es que las encuestas no han ido mal últimamente. En España han sido más certeras en los últimos cinco años, aunque hay excepciones como las elecciones andaluzas de 2018. Las encuestas rara vez son perfectas, pero no hay alternativa que haya demostrado ser mejor.
Montse Hidalgo Pérez contribuyó a esta historia.
¿Quieres más información? Suscríbete aquí Boletín Kiko Laneras Analiza e interpreta eventos actuales con datos y gráficos.
«Pensador malvado. Erudito en música. Comunicador amigable con los hipster. Geek de Bacon. Entusiasta aficionado a Internet. Introvertido».