sábado, 2 de enero de 2016

¿Tongo en la CUP?

El pasado domingo 27 de diciembre, los de la CUP se reunieron en Sabadell para decidir asambleariamente si apoyaban un pacto con Junts pel Sí y, en particular, la investidura de Artur Mas como presidente de la Generalitat catalana. Como es sabido, la última votación arrojó un empate a 1.515 entre las dos opciones sobre las que finalmente se votó. Inmediatamente, la casi totalidad de los medios hablaron de lo insólito del resultado dejando caer, con mayor o menor elegancia, insinuaciones de que se había amañado. El asunto me llamó la atención y me he entretenido haciendo algunos números y jugando con la Excel. Resumo a continuación este divertimento inofensivo, advirtiendo de antemano que se trata de un texto bastante infumable, sólo apto para quienes gusten de cifras. Por eso, para evitar aburrimientos innecesarios, todo el rollo de elucubraciones estadísticas lo he puesto en otro color; el lector puede saltárselo alegremente y pasar a los dos últimos párrafos del post.


En la votación definitiva de la asamblea de la CUP se contabilizaron 3.043 votos. Cada votante debía elegir entre dos opciones: la A, que equivalía a aceptar las medidas políticas de la propuesta de Junts pel Sí y que Artur Mas fuera el próximo presidente de la Generalitat, o la B, que significaba rechazar la investidura de Artur Mas como presidente de la Generalitat y seguir negociando con Junts pel Sí. Pero lo cierto es que también podían votar en blanco o emitir un voto nulo y, como ambas son indiferentes a nuestros efectos, las integraremos en una tercera opción C. ¿Cuántos resultados posibles podían darse? Imaginemos que, en vez de mediante papeletas, los participantes expresaran su opción poniéndose un jersey: azul en la opción A, rojo en la B y blanco en la C. Si suponemos que todos formaran una fila, habría tantos resultados distintos como posibles variaciones en la sucesión de colores de los jerseys. El total de resultados distintos es de 3 elevado a 3.043, un número inconcebiblemente inmenso. Y cuando digo que es inconcebible no exagero: si los 3.043 asambleístas formados en fila se fueran cambiando de jersey ordenadamente tardando sólo un segundo, todos los segundos transcurridos desde el Big Bang hasta la fecha no les serían suficientes. Pero no crean que les bastaría con el tiempo de dos, tres o cuatro universos; no, el número de universos consecutivos consecutivos que necesitarían sería, más o menos, un 1 seguido de 1.434 ceros. Alucinante.

Ahora bien, cada una de estas muchísimas posibles votaciones tiene un resultado que se puede expresar como una terna, cuyos componentes son, respectivamente, los números de votos de la opción A, de la opción B y de la opción C. Por ejemplo, una de estas ternas posibles sería 1.515-1.515-13 (que es la que salió), pero también podría haber sido 0-3.043-0 (se rechaza a Mas por unanimidad) o 500-499-2.044 (ganan por la mínima los que apoyan la investidura de Mas pero los que se abstienen son mayoría frente a las otras dos opciones: complicada puesta en práctica de la decisión). Leo en La Vanguardia que cualquiera de estas ternas es igual de probable, pero eso no es cierto; ni siquiera lo sería si sólo hubiera dos opciones (que es como erróneamente lo plantea el periodista). Simplifiquemos, para que se entienda fácilmente, a sólo cuatro votantes a los que se les deja sólo dos opciones, la A y la B. Como es fácil de ver, hay 16 variaciones posibles que, al convertirlas en pares de resultados, quedan reducidas a 5: 4-0, 3-1, 2-2, 1-3 y 0-4. Pues bien, el número de veces que se da cada resultado es, respectivamente, 1, 4, 6, 4 y 1; nada de igualdad de probabilidades. Para cualquier número n de votantes, si sólo hay dos opciones, el número total de pares de resultados es siempre n+1 (empezamos dando 0 votos a la primera opción y n a la otra, y seguimos sucesivamente sumando 1 a la primera y restando 1 a la segunda hasta llegar a n y 0 respectivamente). Con tres opciones el número total de ternas de resultados es también fácil de calcular (aunque me van a excusar de explicarlo) y resulta de la expresión (n+1)•(n+2)/2. Es decir, que en nuestro caso, con 3.043 votantes, el número total de resultados posibles distintos asciende a 4.634.490 (el periodista de La Vanguardia da el total para sólo dos opciones que es bastante menor, claro: 3.044).

Esas ternas de resultados son muy fáciles de generar (0-0-3.043; 0-1-3.042;•••;3.042-1-0 y 3.043-0-0) pero son demasiadas hasta para la Excel. Por entretenerme un rato, he generado las 5.151 ternas que salen si fueran cien votantes, y luego he contado cuántas de ellas dan empates entre las dos opciones válidas A y B (obviamente, hay el mismo número de victorias de A que de B); son 51, que equivale casi al 1%. También he comprobado que el porcentaje de resultados empate sobre el total de ternas desciende a medida que aumenta el número de votantes (por ejemplo, con 4 votantes el porcentaje de empates sobre el total de resultados posibles es del 23,5%). Por tanto, con 3.043 votantes, el número de resultados de empate tiene que ser un porcentaje muy pequeño sobre las 4.634.490 ternas posibles. Vuelvo a insistir en que ese porcentaje no es la probabilidad, porque no todos los resultados distintos se repiten el mismo número de veces (suponiendo que la decisión de cada votante entre las tres opciones tiene la misma probabilidad). Seguro que hay algún modo de calcular analíticamente (y no a base la "fuerza bruta" de Excel que, además, me temo que no da para tanto) tanto el número de resultados empates como la probabilidad de cada uno de ellos, pero me exigiría más dedicación de la que dispongo. En todo caso, aceptemos, aunque no sepa cuantificarla, que la probabilidad de que el resultado de una elección entre dos opciones con la posibilidad de votar nulo acabe en empate es muy pequeña, pero desde luego no nula (volveré sobre el asunto).

Pero es que creo que los cálculos se pueden simplificar si, conociendo como se planteó la votación asamblearia, hacemos algunas hipótesis con un grado de verosimilitud razonable. A la Asamblea no se le presentaron las dos opciones A y B descritas sino cuatro; la C era rechazar la propuesta política de Junts pel Sí pero facilitar la investidura de Mas y la D también rechazar la propuesta política pero abstenerse en la investidura, lo que haría que Mas necesitara solo un voto para la mayoría simple (en vez de los seis que requeriría si la CUP votara en contra). Ese método decisorio no es ninguna novedad y, a mi modo de ver, el más democrático cuando de lo que se trata es de elegir una opción entre varias (que es lo que ocurre casi siempre, aunque no nos lo muestren). Exige, claro, que se definan bien las opciones posibles y no se hagan trampas (como, por ejemplo, en las alternativas que suelen plantearse en los referenda). Se empieza votando a todas las opciones y para la segunda ronda se descarta la que ha obtenido menos votos, se repite la votación con una opción menos y así sucesivamente hasta la definitiva entre sólo dos alternativas. Aunque, en teoría, nada impide que quien haya votado a una opción que ha salido en la siguiente ronda apueste por otra, la gran mayoría de los votantes mantendrán el voto a la opción elegida la primera vez hasta la ronda en la que ésta ya esté descartada. Esta es la hipótesis que asumo que, aún consciente de que suprime posibilidades, vale para simplificar mucho los cálculos. Porque, al final, de lo que se trata es de determinar las probabilidades en la ronda definitiva y, con este supuesto, nos basta analizar los votos de quienes en la ronda anterior no eligieron ninguna de las dos opciones finalistas, en el supuesto de que quienes sí lo hicieron mantienen su decisión.

Aplicando las anteriores consideraciones a la asamblea de la CUP, sabemos que en la segunda ronda se decidía entre las opciones A, B y C que obtuvieron, respectivamente, los siguientes votos: 1.482, 1.512 y 28; además hay que contar 20 votos entre blancos y nulos. Por tanto, asumo que quienes decidían en la tercera y definitiva elección entre A y B eran 49: los 28 de la opción C, los 20 blancos y nulos y 1 más que debía haberse incorporado a última hora. Podrían ser más si algunos de quienes votaron en la segunda ronda se hubiera retirado y hubiesen entrado más nuevos, pero carezco de datos para tener este supuesto en cuenta. Aún fijándonos sólo en esos 49 votantes, el número de variaciones posibles –los cambios de jersey a que me refería en el primer párrafo– sigue siendo demasiado grande, exactamente 239.299.329.230.617.000.000.000 (pero Excel lo calcula, lo que no puede hacer con las variaciones de los 3.943 votantes). Volviendo a la imagen de los cambios ordenados de jersey en un segundo, en este caso los 49 asamblearios de la CUP podrían completar todas las variaciones en el tiempo equivalente a 553.499 veces el transcurrido desde el Big Bang; seguimos en órdenes de magnitud inconcebibles, ¿verdad? Dado que no he deducido analíticamente cómo calcular las probabilidades, la solución de la "fuerza bruta" consistiría en (1) generar todas las variaciones, (2) convertir cada una de ellas a un resultado ternario (votos A-votos B-votos blancos y nulos) y (3) asignar a cada resultado ternario la decisión final (gana A, gana B, empate). Hecho esto, se dividiría el número de empates entre el número total de variaciones (239.299.329.230.617.000.000.000 ) y el cociente sería la probabilidad, suponiendo que cada variación es equiprobable, lo cual no es así en mi opinión. El problema es que Excel tiene un límite de 1.048.576 filas, así que necesitaríamos más de 228 mil trillones de hojas de cálculo para hacerlo. Imposible, claro, porque además no debe haber ordenador con esa capacidad de proceso (o estaría procesando durante un tiempo también de orden de magnitud de la edad del universo).

Lo que sí se puede hacer es saltarse el primer paso anterior y generar directamente todas las ternas posibles de resultados, pues éstas no son más que 1.275. Nos salen 25 resultados de empate (frente a 625 de victoria de cada una de las opciones), lo que equivale a un 1,96%. Como ya he dicho, no todos los resultados salen el mismo número de veces por lo que no puedo asegurar que este porcentaje sea la probabilidad del empate. Sin embargo, intuyo que puede haber una cierta regularidad en la distribución de las victorias y empates en las variaciones que constituyen cada terna, lo que me sugiere que es posible que la probabilidad matemática del empate oscile en torno al 2% (con las simplificaciones que estoy haciendo). Nótese que el porcentaje es el doble que en el tanteo anterior que hice para cien votantes, confirmando lo ya señalado que la probabilidad del empate disminuye cuantos más son los electores. Con todas las prevenciones que se quieran llegamos así a una primera conclusión importante: si, como estoy suponiendo, fueron las 49 personas que no habían votado las opciones A o B en la ronda anterior quienes decidieron el resultado, que saliera el empate no es un resultado "altísimamente improbable" o "prácticamente imposible" como han repetido hasta la saciedad los medios; tenía la misma probabilidad de que ganemos un sorteo en el que sólo hay cincuenta papeletas.

Pero es que esa probabilidad todavía, creo yo, es mayor porque no deberían considerarse equiprobables todas las variaciones. Nótese que cada una de las tres opciones de la segunda ronda de votación puede simplificarse en valores binarios respecto a dos asuntos: el apoyo/rechazo a la investidura de Mas y la aceptación/rechazo de la oferta de Junts pel Sí, tal como se representa en la siguiente tabla:


Las 28 personas que habían elegido la opción C en la ronda anterior se encontraban ahora con el dilema de priorizar una de sus decisiones frente a la otra. Si daban más importancia a la elección de Mas que al rechazo de la propuesta política de JxS, votarían la opción A. Si, por el contrario, les parecía más importante rechazar el acuerdo político que investir a Mas, votarían la opción B. Por último, quienes no tuvieran se atrevieran a descartar uno de sus deseos a favor del otro, probablemente votarían nulo o blanco. Conociendo lo que se jugaba, creo que lícito suponer que la mayoría de los votantes de C en la segunda ronda daban más importancia a su preferencia por que Mas fuera investido (convencidos, por ejemplo, de que en caso contrario habría nuevas elecciones y se arriesgaba la continuidad del proces) que a la de rechazar la propuesta de JxSí (ya habría tiempo para sacarles concesiones durante el gobierno). De hecho, visto a posteriori, así se confirma con los resultados de la tercera ronda ya que la opción A aumentó en 33 votos mientras que la B sólo en 3. Pero imaginemos que no sabemos lo que ocurrió y admitamos ese supuesto, lo que implica a efectos de cálculo que la probabilidad de que un elector C votara en la tercera ronda a A es mayor que la de que votara a B. Naturalmente, cuantificar estas probabilidades medias individuales es imposible, pero para hacer un tanteo pongamos que la probabilidad de votar a A es de 2/3 mientras que el tercio restante se distribuye a partes iguales entre votar a B y votar en blanco o nulo. En cuanto a los veinte electores que votaron blanco o nulo en la segunda ronda, hay que suponer que la mayoría se mantendría; haciendo otro ejercicio de cuantificación, digamos que la probabilidad de voto blanco o nulo sea de 2/3 mientras que el tercio restante iría una mitad a cada opción válida. Por último, las probabilidades para el que se incorporó en la tercera ronda, lo más razonable es hacerlas igual a 1/3 a cada una de las tres posibilidades. Al margen de cuantificaciones, lo que quiero resaltar es que al considerar que la decisión de cualquier votante no era equiprobable entre sus tres opciones sino que venía muy condicionada por su elección previa, podía preverse antes de la tercera ronda que aumentaría la opción A y, consiguientemente, las probabilidades de un empate. Aunque no sepa calcularlo, no me sorprendería que la probabilidad teórica del empate después de la segunda ronda resultara del orden, como mínimo, del 5% (recuérdese que, suponiendo que cada uno de los 49 electores decisivos votara aleatoriamente, la habíamos fijado en torno al 2%). Que salga una opción que tenía un 5% de probabilidad no es, desde luego, ningún suceso extraordinario.



En resumen, tras hacer algunos números y supuestos, y a pesar de mis carencias analíticas, concluyo que la probabilidad de que en la tercera ronda de votaciones de la asamblea de la CUP saliera, como así fue, un empate no es para nada algo “casi imposible” ni tampoco –como ha escrito un articulista en Tenerife– equivale a “saltarse todas las leyes de la estadística”. Nos olvidamos además de que la serie de las 3.043 decisiones individuales que adoptaron en la tercera votación esos tantos electores nos parece significativa porque tenía el mismo número de votos A que de votos B, pero desde el punto de vista de la estadística, es tan relevante (o sea, nada) como si correspondiera a cualquier otro resultado que no nos hubiera sorprendido. Viene a ser lo mismo que si en la lotería de Navidad sale el 55.555 y proclamáramos que ha habido tongo; obviamente, ese número tan “llamativo” tenía la misma probabilidad que el 72.324, por ejemplo, que no nos dice nada. Y, ya de paso, la probabilidad de que nos hubiera tocado el número que compramos en la Lotería de Navidad era del 0,001%; calculo que entre mil y cinco mil veces menor que la del empate de la CUP. Así pues, en mi opinión, no hay fundamentos serios para sospechar de que el resultado de la asamblea del pasado domingo estuviera amañada.

Por último, quienes se apresuran a acusar de tramposos a los de la CUP deberían explicar algunas cosas. En primer lugar, cómo lo hicieron; porque no se me antoja fácil conseguir manipular la contabilización de votos (había varias “urnas”) para alcanzar el empate que se supone que querían los presuntos fulleros. Y, en segundo lugar, con qué objeto deseaban que el acuerdo de la decisión de la Asamblea acabara en tablas. Naturalmente, ninguno de los que se han apresurado a insinuar que los “independentistas antisistema” manipulan los resultados, se dignan bajar a estos detalles (como tampoco se molestan en reflexionar sobre si realmente el resultado era tan improbable como dan por supuesto). Puestos a buscar motivaciones, me es más fácil encontrarlas en estos corifeos mediáticos del sistema: lo que nos quieren hacer ver es que estos tipos son una grave para la democracia porque manipulan hasta sus propias votaciones. En fin, a ver qué pasa mañana.

9 comentarios:

  1. Yo sí veo varias formas de manipular la votación durante la contabilidad de los votos (secretos), y también veo detrás razones para desear ese empate y seguir manteniendo una incertidumbre que les beneficia y les coloca más tiempo en el centro de la política catalana. Por otra parte, cualquiera que conozca algo la teoría de probabilidades matemáticas sabe de los imporbable de tan resultado

    ResponderEliminar
    Respuestas
    1. “Cualquiera que conozca algo la teoría de probabilidades matemáticas sabe de lo improbable de tan resultado”. Pues a mí, que no debo saber ni siquiera algo de probabilidades, no me parece tan improbable; o, al menos, no tan improbable como se ha asegurado en los medios. De hecho, para llegar a esa conclusión me he pasado unas cuantas horas haciendo números. Entiendo que, siguiendo mi propio consejo, no hayas querido leer la explicación que hago para justificar mi conclusión. Para no repetirla, te describo a continuación un escenario que intuyo es uno de los que me parece más verosímil que ocurriera, a ver si te parece altamente improbable.

      Qué paso en la 3ª votación. Los que en la segunda votaron la opción A repiten su voto, y también lo hacen quienes votaron la opción B; ¿por qué habrían de cambiarlo? Los 28 que en la segunda ronda votaron por la opción C tienen que cambiar su voto y optan en bloque por la B, ya que apoyaban la investidura de Mas. De los veinte que habían votado nulo en la anterior ronda, 13 siguen en la misma posición pero 7 cambian: 4 votan a la opción A y 3 a la B. Finalmente, el votante que entró a última hora, se decanta por la opción A. Resultado: 1515 a 1515.

      En cuanto a las varias formas de manipular la contabilización de los datos, a mí también se me ocurren, pero, a poco que hayan tomado unas elementales normas de seguridad, ninguna es fácil. Y que los de la CUP (se supone que algunos dirigentes entre los 3.043 de la asamblea) quisieran manipular los resultados para que saliera empate a fin de estar más tiempo en el ojo del huracán … pues qué quieres que te diga: me parece una motivación bastante floja, cuando no contraproducente, como los acontecimientos parecen demostrar. El empate lo único que le ha reportado a la CUP son acusaciones de tramposos.

      Eliminar
    2. No,a la CUP le beneficia la incertidumbre, siguen teniendo algo más de tiempo la sartén por el mango, no tuvieron un gran éxito electoral, pero si se repiten las elecciones ctalanas podrán subir a costa de Junts per si.

      Probabilidades... no pretendo ningún argumento de autoridad, pero no se trata de 28, 13, 4, y 3, sino de 1515 vs 1515. Tu suposición de que de 28 cambian 13 etc. es una suposición, no teoría de probabilidades.

      Eliminar
  2. Análisis correcto, aunque no me meto en si ha sido amañado o no. Improbable, pero no imposible y sin otras fuentes no podemos salir de la duda.

    ResponderEliminar
  3. La CUP tiene un cáncer, Artur Mas,y no se sabe si está controlado. Pero el paciente es tonto, eso aparte

    ResponderEliminar
  4. La distribución que rige los experimentos en la que solo son posibles dos resultados, como sucede al lanzar una moneda, recibe el nombre de distribución binomial.

    En la distribución binomial si un suceso tiene una probabilidad de éxito p el otro tiene por lógica una probabilidad 1 - p.

    La función de probabilidad, que nos da la probabilidad de éxito de un suceso determinado, viene dada por la expresión:

    f(x)= C(n, x) p^x (1-p)^(n-x)

    siendo C(n, x) las combinaciones de n elementos tomados de x en x.


    De manera que si asumimos que los votantes de la asamblea votaron a cara o cruz (despreciamos votos en blanco, nulos y abstenciones) la probablidad de que al lanzar 3030 veces una moneda salgan exactamente 1515 caras es:

    f(x=1515)= C(3030, 1515) (1/2)^1515 (1/2)^1515

    y ese número es:

    0.01449 = 1.45 %

    Probabilidad pequeña, pero no despreciable.

    ResponderEliminar
    Respuestas
    1. Números, revisa tus cálculos porque la probabilidad que planteas es muchíiiiiiiisimo más pequeña. De todas maneras, dada la mecánica del sistema de decisión que adoptó la CUP, no creo que la cuetsión haya de plantearse sobre la probabilidad de los votos aleatorios de 2.030 personas sino sólo sobre 49 votos. Pero, en fin, ya lo he contado en el post, a cuyos argumentos ni tí ni Lansky se refieren, con lo que me temo que esto es un diálogo de sordos. Pero ya lo preveía.

      Eliminar
    2. Este comentario ha sido eliminado por el autor.

      Eliminar
  5. Miros no acabo de entender que quieres decir con: "porque la probabilidad que planteas es muchíiiiiiiisimo más pequeña". (Quizás influya el hecho de que sea lunes por la mañana). Quiero dejar claro que a mí no me parece, ni mucho menos, que una probabilidad del 1,49% sea pequeña y de hecho no creo que haya habido tongo.

    Ahora, volviendo a los argumentos del post, aclaro que me estoy limitando a hacer la aproximación analítica a la que haces referencia en tu pòst sobre el total de los votos emitidos; porque hacerlo sobre los 49 presenta una serie de problemas.

    De entrada asignar la probabilidades a cada opción (votar A, votar B, votar C, voto blanco/nulo). Cuando se desconoce la probabilidad de un suceso, en estadística se recurre a la frecuencia relativa; porque hay un teorema (leyes de los grandes números) que asegura que la frecuencia relativa tiende a la probabilidad.

    Dado que el tamaño de la muestra es grande podemos asociar la probabiidad de cada opción en función de su frecuencia relativa obtenida de la la primera votación. Así las probabilidades son:

    p(opción A) = 1482/3042 = 0,4872
    p(opción B) = 1512/3042 = 0,4970
    p(opción C) = 29/3042 = 0,0092
    p(nulo/blanco) = 13/3042 = 0,0066

    Este resultado justifica las simplificaciones que hice al trabajar sobre la totalidad de la muestra. A saber

    p(opción A) = p(opción B)
    p(nulo/blanco) = 0

    Ahora bien si trabajamos sólo sobre los 49 votos emitidos, de entrada no podemos despreciar la p(nulo/blanco) porque una frecuencia de 13 votos sobre 49 NO es despreciable. Así que tenemos que abandonar la distribución binomial e irnos a una multinomial, donde pueden aparecer x1, x2, ..., xn sucesos cada uno de ellos con una probabilidad p1, p2, ..., pn. En ese caso la probabilidad de que el suceso xi aparezca exactamente ki veces (k1 + k2+ ... + kn = m) viene dada por:

    P(x1=k1, x2=k2, ..., xn=kn)= m!/(k1! k2! ... kn!) * p1^x1 * p2^x2 *...pn^xn

    En nuestro caso podemos simplificar haciendo

    p(Opción A) = p(Opción B) = 0,4967
    p(blanco/nulo) = 0,0066

    y tendríamos que calcular la probabiidad de que en 49 votos se diese el resultado 33-3-13 siendo las probabilidades de cada uno de ellos:

    0,4967 - 0,4967 - 0,0066


    P(x1=33, x2=3, xn=13)= 49!/(33! 3! 13!) * 0,4967^33 * 0,4967^3 * 0,0066^13


    En ese caso la probabilidad viene a ser igual a

    9,69 x 10^(-23) %

    o dicho en castizo:

    "Ni de coña marinera"

    P.D Que quede entre nosotros, pero he hecho trampa en el razonamiento. Te dejo a ver si lo descubres y una vez corregido calcules la nueva probabilidad. (Te sorprenderás entonces del valor real).

    ResponderEliminar