Reporte 1 Agosto 2022 - Plebiscito Salida

Reporte Coyuntural
RESUMEN
Pronóstico -Se presenta modelo

matemático que
electoral: ¿Cuál pronostica con cierta
eficacia resultados
electorales recientes
sería el resultado en Chile.
-Para el plebiscito de
entrada, el modelo
si el plebiscito arrojó como resultado
que la opción Apruebo
ganaría con un 77.80%
fuese mañana? de las preferencias,
mientras resultado
01-08-2022 final fue de 78.28%.
-Para la segunda vuelta
Presentación entre Boric y Kast el
El presente documento es el segundo reporte en serie que indica los modelo pronosticó un
resultados de un análisis predictivo sobre el avance del clima electoral de cara triunfo de Boric por un
al plebiscito de salida para la propuesta de Nueva Constitución en Chile para 57% contra 43% de
el año 2022. Este análisis trabaja con datos masivos aleatorizados y Kast, mientras
normalizados que se obtienen desde las tendencias de Google, registrando el resultado final fue de
interés en el tiempo que generan ciertos conceptos buscado, en esta ocasión
referidos al apruebo y al rechazo. No es una encuesta, sino un modelo 55.64% para Boric.
matemático en base a la interacción en el mundo virtual, específicamente a las -Si el plebiscito fuera
series de interés en el tiempo de Google Trends. Se basa en el supuesto de mañana, el modelo
que las personas que participarán de un proceso electoral buscan información indica que la opción
sobre las alternativas disponibles para informar su voto, o bien, participan de APRUEBO ganaría con
campañas de forma activa, interactuando con los conceptos asociados a cada
un 56.6% por sobre el
campaña en redes sociales e internet. Buena parte de estas interacciones son
recogidas por los motores de Google. El uso de esta técnica de análisis es Rechazo.
relativamente reciente en la literatura, pero con buenos resultados en otras
investigaciones similares1. En este caso, se aplica un método estadístico de
modelación futura por serie de tiempo usando la técnica ARIMA, o modelo autorregresivo integrado de
media móvil2. Esta técnica toma una serie de datos ordenadas temporalmente e identifica a partir de su
1 Riccardo Cantini et al., ‘Analyzing Political Polarization on Social Media by Deleting Bot Spamming’, Big Data and Cognitive Computing 6, no. 1
(4 January 2022): 3, https://doi.org/10.3390/bdcc6010003; Maryam Bilal et al., eds., ‘2018 Pakistan General Election: Understanding the
Predictive Power of Social Media’, in 2018 12th International Conference on Mathematics, Actuarial Science, Computer Science and Statistics (MACS), 12
(Karachi, 2018); Harald Schmidbauer, Angi Rösch, and Fabian Stieler, ‘The 2016 US Presidential Election and Media on Instagram: Who Was
in the Lead?’, Computers in Human Behavior 81 (April 2018): 148–60, https://doi.org/10.1016/j.chb.2017.11.021.
2 Damodar N. Gujarati and D. C. Porter, Basic of Econometric, Fifth Edition., Econometrics, 2009.
1
propia historia estadística, cual es el valor futuro más probable, indicando también márgenes de error. El
uso de esta técnica de análisis fue calibrado usando datos coyunturales durante otras elecciones recientes
en Chile. En el plebiscito 2020, el modelo recogió datos para las últimas tres semanas de la campaña
electoral hasta el día anterior del plebiscito por una Nueva Constitución a celebrarse el 25 de octubre
2020. En esa primera aproximación el resultado del modelo fue de un 77.92% para el apruebo, mientras
que el resultado electoral real fue de 78.28% para el apruebo. De manera similar, para la elección Boric y
Kast se hizo el mismo ejercicio. Los resultados de este ejercicio predictivo fueron publicados en este
vínculo, indicando que Gabriel Boric obtendría un 57.27% y José Antonio Kast un 42.73%, registrando
en esta ocasión una diferencia de 1.63% con el resultado definitivo de esa segunda vuelta, logrando así
similar precisión que la encuesta Criteria (diferencia de 1.6%), CADEM (diferencia de 2.64%), Pulso
Ciudadano (3.36%) y Atlas Intel (4.64%). Si bien el modelo fue menos preciso que el del plebiscito, frente
a otros instrumentos de medición logra resultados competitivos. En este segundo ensayo, se puede
comenzar a idear la hipótesis de que en Chile se pueden generar pronósticos en base a modelación
matemática a partir de datos de redes sociales. El supuesto aun se encuentra en discusión, pero los
resultados indican buena capacidad predictiva. Se plantea que la interacción entre las personas y las
opciones electorales en búsquedas, noticias y actividad en general en internet forma parte de un proceso
tendiente a informar la decisión de voto o bien sobre la adhesión sobre una de las opciones. Una vez que
el voto esta informado y la adhesión consolidada -es decir, más cerca de la elección, el modelo indicaría
el dominio de una opción electoral sobre otra. A partir de este supuesto, el impacto del voto obligatorio
debiera estar representado en este análisis, aunque eso recién lo confirmaremos o rechazaremos el 5 de
septiembre de 2022.
Pronóstico 01/08/2022
Desde que se publicó el primer pronóstico en El Desconcierto, diferentes preguntas en redes sociales
buscan comprender mejor el enfoque metodológico de esta serie de pronósticos. Intentaremos
responder las principales dudas. Lo primero, existen dos tipos de series para realizar estos análisis, las
series diarias (con datos cada hora en tiempo real) y las series mensuales o extendidas en el tiempo (con
datos diarios). Las series diarias se nutren de interacciones en redes en tiempo real, es decir, marcan los
registros instantáneos de las interacciones que a partir del muestreo aleatorio que realiza Google indican
la relación de interés de un termino en una hora durante el día. Como indica Simon Rogers de Google,
las series en tiempo real muestran las reacciones de las personas a los términos que buscamos en el
tiempo. Las series diarias registran esas reacciones, mientras que las series mensuales muestran datos
normalizados, más fiables para estudios más a largo plazo pero en menor frecuencia. Por un lado, los
datos diarios permiten medir climas específicos (en intervalos de semanas), las series mensuales
permiten medir impactos sostenidos. Sobre la modelación del voto obligatorio, posiblemente el efecto
sobre el muestreo se verá muy encima de las elecciones y el resultado que se presenta aquí es más
indicativo de grupos de personas que se informan e interactúan activamente con las opciones
disponibles, mientras que quienes votarán literalmente obligados, aparecerán recién hacia el final de la
campaña, pocos días antes del 4 de septiembre 2022.
En lo concreto para este reporte, tomamos la serie diaria dado que la serie mensual toma un par de días
en normalizarse mientras que las series diarias sirven el cometido de medir el clima electoral de hoy para
mañana, respondiendo así a la pregunta:
¿Cuál sería el resultado electoral si el plebiscito de salida fuera mañana?
2
Se recogen los datos de los últimos 21 días (504 horas) de interacciones en internet para revisar el
interés que despiertan las opciones Apruebo o Rechazo, con filtros de exclusividad para una o para otra
(es decir, tomar solo aquellas que hablan de Apruebo o solo aquellas que hablan de Rechazo). El
resultado es el siguiente:
Diferencia con Rango (error

Origen de datos Resultado Sigma2
encuesta CADEM estándar)
Modelación 56.6% Mínimo: 37.66%

18.6% 0.007864
CADEM 38% Máximo: 74.65%
Si la elección fuese en 24 horas, la opción Apruebo tendría un 56.6% de las preferencias y la opción
rechazo un 43.4%. Si bien estas debieran ser buenas noticias para la campaña del Apruebo, dado que
aumentó la ventaja entre los promedios de ambas opciones, pero es importante mantener en vista que es
una medición de clima electoral mas que de resultados finales aún. El margen de error sigue indicando
que la elección está abierta, dado que en base a los resultados de este modelo aun se puede dar un
resultado de 62.34% para el Rechazo y 37.66% para el Apruebo, así como también se puede dar el caso
de un 74.65% para el Apruebo y 25.35% para el Rechazo. Este margen no permite dar ganador a ninguna
de las opciones, pero el Apruebo está mejor aspectado.
Este modelo predictivo ha mostrado una eficacia importante en otras elecciones y, por ende, se indica
que en base a dichos resultados anteriores, este resultado tiene asidero. De todos modos, este resultado
se sustenta en una variable temporal clave: la elección no es mañana. Por lo tanto, lo que entregamos
como medida es mas bien como avanza el interés en Chile por parte de las personas que entran a Google
al buscar una opción sobre la otra, que en las ultimas elecciones han indicado con alta precisión quien
ganará la elección. La precisión debiera aumentar a medida que se acerque la elección y solo pocos días
antes se podrá entregar un pronóstico sobre los resultados más que sobre el clima electoral.
Fig 1. La figura indica el resultado (azul) del pronóstico.
3
Detalle Metodológico
La estimación toma una base total de 504 observaciones en tiempo real desde el 16 de julio de 2022 a
las 17.00 hrs. GMT hasta el 01 de Agosto de 2022 hasta las 21.00 hrs. GMT. Los resultados de los
pronósticos para las 24 horas después del corte de medición se ven a continuación:
Pronóstico Mínimo Máximo Error estándar

0,56300584 0,47485743 0,65115426 0,08814841
0,57102833 0,48280418 0,65925247 0,08822415
0,55132336 0,45633983 0,6463069 0,09498354
0,58300797 0,48799686 0,67801907 0,0950111
0,54898509 0,44716172 0,65080846 0,10182337
0,57625743 0,47371785 0,67879702 0,10253958
0,55533114 0,44861006 0,66205222 0,10672108
0,57835054 0,47151187 0,68518921 0,10683867
0,55503212 0,44411444 0,66594981 0,11091768
0,57730884 0,46631457 0,6883031 0,11099427
0,55707545 0,44225237 0,67189853 0,11482308
0,57601676 0,46118505 0,69084847 0,11483171
0,55744197 0,43934538 0,67553856 0,11809659
0,57524028 0,45714313 0,69333742 0,11809715
0,55834033 0,43733378 0,67934689 0,12100655
0,57429697 0,45328763 0,69530631 0,12100934
0,55908642 0,43552545 0,6826474 0,12356098
0,57365027 0,4500737 0,69722684 0,12357657
0,55977604 0,43390218 0,68564991 0,12587386
0,57297911 0,44706978 0,69888844 0,12590933
0,56041733 0,43243426 0,6884004 0,12798307
0,57239277 0,44434855 0,700437 0,12804423
0,56097574 0,43104611 0,69090536 0,12992963
0,57185057 0,44183203 0,70186911 0,13001854
Como se indicó en la primera parte, el resultado más preciso se obtuvo en base a series mensuales con
baja frecuencia que sirvieron para pronosticar eficazmente el resultado del plebiscito de entrada de
2020, un mes antes de la elección. Al aplicar exactamente la misma metodología con datos de hace 30
días desde el 28 de Julio 2022, pero en series mensuales (normalizadas por Google) el resultado es el
siguiente: Box-Ljung test = 0.1349 (valor de p), sigma2 modelo ARIMA = 0.0103. Pronóstico: 58.54%
Apruebo (min: 48.39% - max: 68.69%), 41.46% Rechazo (min: 31.31% - max: 51.61%), Error
Estándar = 8.99%. En este modelo, la opción Rechazo tiene muy pocas probabilidades de ganar. No
obstante, es importante plantear que estos datos siguen siendo sobre el clima electoral y no sobre el
resultado del plebiscito.
4
5

Reporte 1 Agosto 2022 - Plebiscito Salida

Uploaded by

Copyright:

Available Formats

You might also like

Reporte 1 Agosto 2022 - Plebiscito Salida

Uploaded by

Document Information

Original Description:

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Reporte 1 Agosto 2022 - Plebiscito Salida

Uploaded by

Copyright:

Available Formats

Reporte Coyuntural

Pronóstico -Se presenta modelo

¿Cuál sería el resultado electoral si el plebiscito de salida fuera mañana?

Diferencia con Rango (error

Modelación 56.6% Mínimo: 37.66%

Fig 1. La figura indica el resultado (azul) del pronóstico.

Pronóstico Mínimo Máximo Error estándar

You might also like