Modelo de Estimación del Resultado Preliminar de la Elección para Presidente de la República 2018 (MEREP)



METODOLOGÍA


CARACTERÍSTICAS.

Este modelo asume una versión simple para los cálculos de los resultados electorales preliminares de la elección para la Presidencia de la República del 1 de julio de 2018, que no requiere la extracción de muestras representativas de la base de datos acumulada por el Programa de Resultados Electorales Preliminares (PREP) ni la disposición de personal en las casillas de votación.

La opción consiste en un ejercicio de simulación que estime los resultados electorales preliminares, pero que elimine los sesgos del propio PREP derivados del arribo no aleatorio ni uniforme de los cómputos de las casillas. Esto se lograría mediante una ponderación de la totalidad de reportes acumulados en el PREP y no de una selección muestral de los mismos.

Este Modelo de Estimación de los Resultados Electorales Preliminares (MEREP) no es una fuente de información original de datos electorales, sino un derivado, cuya fuente no son directamente los datos que se computan en las casillas, sino los reportes acumulados en los PREP, por lo que el modelo se genera a partir de un programa a su vez alimentado por datos computados en los centros de votación que se establezcan para cada elección.

Entre las ventajas de utilizar este modelo se encuentra su economía, derivada del hecho de que no requiere contar con personal alguno para recopilar los resultados de cada una de las casillas. Su operación, además, puede estar a cargo de un grupo relativamente reducido de investigadores responsables.

Con este ejercicio se puede contar con datos con un error mínimo a niveles de confianza convencionales y permite disponer de tendencias confiables de manera oportuna.

Este modelo de estimación sería un instrumento adicional para disponer de información agregada e insesgada de los resultados electorales preliminares, como el conteo rápido institucional y los conteos rápidos privados, pero a diferencia de éstos, supone un ejercicio con pretensión censal, por lo que no demanda contar con una muestra definida previa o posteriormente para impedir o eliminar sesgos en la toma de datos debido a diferenciales en el arribo de datos por casilla por factores diversos.

Teóricamente, efectuar este ajuste permite disponer de estimaciones que dan cuenta de la distribución más probable de los resultados preliminares de la elección, que corrige los sesgos implícitos en el PREP, que sólo tiende a aproximarse a los resultados totales de manera asintótica y paulatina.

Empíricamente puede establecerse que las proporciones de voto por candidato en las elecciones presidenciales previas están fuertemente relacionadas con el estrato en que se ubican las casillas (distrito y condición urbana o no urbana) y por tanto que hay diferencias significativas entre los grupos que pueden amortiguarse por medio del ejercicio descrito.

Cabe mencionar que para que la simulación del resultado preliminar con este modelo sea suficientemente precisa y exacta no se requiere que se disponga de observaciones en la totalidad de los estratos, sino simplemente que la mayoría de ellos cuenten con datos, respecto a los que se efectuaría la imputación y posterior estimación de proporciones, mientras se omitiría cualquier imputación para los estratos sin casos observados en un corte determinado.

Es de explicitarse que este modelo asume el supuesto de que el mejor estimador del resultado en un estrato determinado en un momento definido es el resultado observado en el conjunto de casillas de dicho estrato con datos reportados hasta ese momento, dado que la varianza de las proporciones de votación por casilla dentro de un mismo estrato tenderán a ser menores que cualquier otra estimación posible para subconjuntos de casillas en la elección que pudieran generarse antes de conocer los resultados.

Esto, debido a que la decisión sobre las particiones del universo de casillas en estratos considera los criterios objetivos y disponibles que pueden dar cuenta de mejor manera de diferencias en las proporciones de votación entre casillas dentro del territorio nacional, sin considerar supuestos exógenos a los datos mismos que se acopian y a los resultados que se pretenden estimar: su división en distritos y su condición urbana o no urbana dentro de cada uno de ellos.

FORMALIZACIÓN.

Se parte de distribuir las casillas en estratos, uno por cada distrito electoral en una elección dada y condición urbana o no urbana de las casillas, y de estimar el volumen de electores en cada estrato, lo que es enteramente posible a partir de los datos del Listado Nominal de Electores.

Luego, y conforme vayan arribando, se agruparían los datos reportados en el PREP según el estrato al que pertenezcan en cortes horarios regulares.

Después, simplemente se ajustaría el volumen de votos por contendiente en cada estrato cuál si lo reportado en un corte horario correspondiera a la totalidad de la votación en dicho estrato, lo que se logra multiplicando los votos por contendiente reportados por el inverso de la proporción de electores cuyas casillas han sido reportadas en cada estrato un momento dado.

Formalizando lo anterior: los estimadores para el cálculo de la proporción de voto para cada contendiente () en un corte horario dado (t) resultarán de:

Donde

Los valores de expansión de los casos en muestra vendrán dado por:

Donde

Los intervalos de confianza de cada estimador se calcularán con base en:

Donde

Los errores estadísticos de cada estimador () en un corte dado () serán calculados mediante la siguiente ecuación:

Donde