domingo, 21 de febrero de 2016

Ruleta y nacimientos

A Vanbrugh (porque todo este rollo no cabía en un comentario a su último post)

 A principios de los ochenta, un amigo me convenció para ir al casino de Torrelodones, abierto hacía pocos meses, con el cebo de tener un sistema infalible para ganar a la ruleta. Su idea era sencilla: apostar a suertes sencillas (rojo/negro, par/impar, falta/pasa); si se ganaba, estupendo, si no, se doblaba la cantidad sobre la misma apuesta y así sucesivamente. Se suponía que era muy improbable –casi "estadísticamente imposible"– que saliera muchas veces seguida la suerte contraria a la que apostábamos, con lo cual teníamos siempre que acabar ganando. El problema estaba, claro, en que al doblar las apuestas entrábamos en un crecimiento exponencial de las posibles pérdidas que, al final, se compensaba con una ganancia igual al monto de la primera apuesta. Creo recordar que empezábamos con 500 pesetas que era la cantidad mínima admitida (y también el precio de la entrada al casino). Si perdíamos, había que poner 1.000, luego 2.000, luego 4.000, luego 8.000 ... En la tablita que adjunto puede verse la cantidad a colocar sobre el tapete en cada apuesta sucesiva (hasta la décima) y en la tercera columna indico lo que se llevaba apostado; en la cuarta columna pongo la cantidad que pagaba el casino en cada apuesta si se ganaba. Finalmente, en la quinta aparece la ganancia final de una serie de apuestas que acaba bien y que, obviamente, es la diferencia entre lo que paga el casino y lo que se lleva acumulado; como puede comprobarse, independientemente de en que número de apuesta se gane, siempre se ganaba quinientas pesetas, la puja inicial.

Yo había limitado mi inversión total a unas treinta mil pesetas, que venía a ser lo que ganaba al mes. Así pues, tenía capital para hacer un máximo de seis apuestas, como puede verse en la tabla (en realidad, al hacer la sexta puja sumaba 31.500 pesetas que, con las 500 de la entradas, elevaban a 32.000 mi límite exacto de inversión). Imaginemos que decidía apostar al rojo. Siempre que no salieran seis negros seguidos ganaba mi apuesta; ahora bien, como se me cruzara una serie de seis negros, perdía treinta y dos mil calas de entonces, lo cual para mí era poco menos que una catástrofe. Puede imaginarse el estado de nerviosismo de aquel chaval poniendo treinta y dos fichas sobre el rombo rojo y sabiendo que de ganar iba a llevarse sólo quinientas pelas, pero que si perdía ... Era demasiado riesgo, de modo que opté por reforzar las probabilidades a mi favor y no empezaba a apostar hasta que se daba una serie de cuatro rojos o negros seguidos. Cuando eso ocurría, ponía la ficha en el color contrario; por tanto, para arruinarme tenía que salir diez veces seguidas el otro color. ¡Diez veces seguidas! Sumamente improbable. De hecho, como calculé enseguida, la probabilidad era más o menos de una serie de diez cada mil.

Así que, más tranquilo, inicié mi aburrido trabajo de apostante metódico, yendo casi todas las noches al casino como quien va a la oficina. Convertía mi dinero en 63 fichas, elegía una mesa de ruleta y me afincaba allí, libreta en mano, para apuntar la sucesión de rojos y negros. Como era natural, pasaba unas cuantas tiradas sin apostar, ya que tardaba en presentarse una serie de cuatro seguidos; pero no esperaba demasiado. Entonces empezaba a apostar y lo más habitual era que ganara a la primera o segunda puja, con lo cual no llegaba a ponerme demasiado nervioso. Cada noche estaba unas tres horas "trabajando" y me retiraba (me volvía con mi amigo que hacía lo mismo pero en otra mesa). Así durante unas dos semanas, obteniendo unas ganancias modestas pero constantes cada noche, del orden de unas cuatro o cinco mil pesetas. No estaba nada mal; de hecho, la ganancia media correspondería, debidamente actualizada, a unos 105 euros de hoy que, por tres horas de curre (sin contar la hora de desplazamientos) equivale a un sueldo mensual de poco más de dos mil euros (y si le dedicara un horario de "jornada completa", nada menos que unos 5.600 € mensuales). El trabajo era un coñazo, desde luego, pero si se mantenía la racha (y yo estaba bastante convencido de que así había de ser), una fuente magnífica de ingresos, máxime para un chaval de veintipocos años. Después de unos diez días de esta rutina, las ganancias me permitieron elevar mi inversión a una séptima apuesta, de modo que multiplicaba por dos la probabilidad de ganar; ahora, para perder, tenía que salir once veces seguidas el color erróneo, eso ocurría una de cada dos mil series.

Pero ocurrió. Ya no recuerdo después de cuantas series victoriosas jugadas, calculo ahora que habrían sido unas ciento veinte, lo que corresponde a bastantes más si se cuentan las que no jugué porque no se habían dado cuatro colores iguales seguidos. Esa serie nefasta empezó con los cuatro negros seguidos de rigor, y luego con mi primera puja a la que la ruleta contestó con el quinto negro. Seguí sin inmutarme poniendo dos fichas, pero salió el sexto negro. No pasaba nada, al tapete fueron mis cuatro fichas; de nuevo negro, el séptimo seguido. Ya algo nervioso coloqué ocho fichas, con esa apuesta acumulaba 7.500 pesetas invertidas, una cantidad significativa. Salió el octavo negro. Traté de animarme al poner 16 fichas; sólo lo había hechos dos veces antes y en las dos había ganado, pero no fue así en esta ocasión: ya iban nueve negros seguidos. Dudé: retirarse ahora o ser consecuente. Acojonado, conté treinta y dos fichas, nada menos que dieciséis mil pesetas: salió el décimo negro, había sucedido lo que creía casi imposible y esa imposibilidad me estaba costando 31.500 calas. La última decisión, curiosamente, fue la que menos me costó; de perdidos al río, supongo que pensaría. Así que aposté las 32.000 pesetas, el máximo doble que podía permitirme. Mientras la ruleta giraba pensé que era muy improbable una serie de once negros pero, al mismo tiempo, que esa bolita metálica no tenía memoria, que esa tirada era un acto único en sí mismo y que tenía un 50% de probabilidades de perder. Cuando la bola se detuvo en el 13 –negro, impar, falta, cantó el croupier– sentí que me vaciaba por dentro mientras todo a mi alrededor se suspendía. Estuve unos instantes en shock, luego me recuperé, me acerqué al bar y me pedí un gin-tonic. Acababa de perder 63.500 pesetas, más de lo que ganaba en dos meses. Pero afortunadamente, gracias a las ganancias de los días anteriores, la cosa no era tan grave, algo menos de veinte mil de pérdida. Ese fue el precio de mi máster. Busqué a mi amigo, esperé a que acabara de jugar (esa noche también ganó; se estallaría poco más tarde), y nos fuimos. No he vuelto más a un casino.

***

Esta anécdota personal me vale para reflexionar sobre el problema al que ha dedicado Vanbrugh su último post, siempre que asimilemos los nacimientos que se van produciendo en un hospital a sucesivas jugadas a suertes sencillas de la ruleta. Los niños van naciendo de forma continuada de la misma manera que la ruleta está funcionando sin detenerse. Si vamos registrando el sexo de los neonatos compondremos una serie binaria con un número inmensamente grande de elementos (que tiende a infinito), equivalente a la serie de los resultados rojo/negro de muchísimas tiradas de la ruleta. Ciertamente, para toda la serie, el número de varones será igual al número de mujeres, del mismo modo que el número de rojos será igual al de negros (desprecio, a estos efectos, el 0 de la ruleta, donde radica el beneficio asegurado del casino). Pero, si cogemos un intervalo cualquiera de n resultados de esa serie cuasi-infinita, no necesariamente habrá la mitad de niños y la otra de niñas (ni de rojos y negros). Como bien dice Vanbrugh, cuanto mayor sea n (el número de elementos del intervalo o, en su problema, el número de nacimientos diarios en el hospital) más alta será la probabilidad de que los porcentajes se sitúen en torno al 50% o, si se prefiere, más baja la de que haya demasiada divergencia entre machos y hembras. Ahora bien, ¿es imposible que para un valor alto de n se alcance un 60% de varones (o de rojos)?


La probabilidad de que nazca un varón es del 50% (en realidad es ligeramente superior, pero pasemos de matices). En dos nacimientos, hay cuatro resultados posibles (dos niños, niño y niña, niña y niño, y dos niñas) y cada uno tiene la misma probabilidad de ocurrir, un 25%; la probabilidad de que en esta serie tan corta el número de varones sea superior al 60% es, por tanto, del 25% (cuando nacen dos niños), valor bastante alto. En el caso de quince nacimientos (el hospital pequeño del problema de Vanbrugh), el número posible de series distintas de resultados es de 2 elevado a 15, lo que da la bonita cantidad de 32.768. Cada una de estas combinaciones tiene exactamente la misma probabilidad de darse (un 0,003%); por lo tanto, si contamos en cuántas de esas combinaciones hay 9 o más varones (60% o más) y dividimos ese resultado entre 32.768, obtendremos la probabilidad buscada. Pues bien, como al igual que Vanbrugh, también yo me divierto con la Excel pasé a generar todas las posibles series mediante un sencillo algoritmo, de modo que construí una tabla de 32.768 filas; cada fila con una sucesión de ceros y unos en 15 columnas. Añadí una décimo sexta columna en la que simplemente recogía la suma de lass quince cifras de la fila correspondiente. Manteniendo la convención de Vanbrugh de que el 1 representara el nacimiento de varón y el 0 el de hembra, la suma era el total de varones. Luego no tuve más que contar en cuantas filas la suma era de 9 o más, obteniendo el resultado de 9.949 combinaciones, que corresponde al 30,36% del total. Generando 365 series aleatorias de quince elementos (para simular una muestra de un año), Vanbrugh obtiene un porcentaje en torno al 30%; es decir, una muestra de las casi infinitas que pueden resultar da un resultado muy cercano al teórico. Por cierto, si dibujamos un gráfico que, para los quince nacimientos diarios, represente el número de veces que nace cada número posible de varones, el resultado es el que se recoge a continuación (seguro que Vanbrugh reconoce la campana de Gauss).


En el caso de un hospital con cuarenta y cinco nacimientos, el número posible de series distintas de resultados es de 2 elevado a 45, lo que ya da una cantidad de filas excesiva para Excel, algo más de treinta y cinco mil billones. El reto pues, es determinar analíticamente la probabilidad teórica de cualquier frecuencia de nacimiento de varones. Nótese que de lo que se trata es de rellenar una tabla similar a la de la imagen anterior, sea en número absolutos o en porcentaje. De las más de treinta y cinco mil billones de combinaciones distintas de nacimientos según sexo, ¿cuántas tienen 45 varones, cuántas 44, cuántas, 43 y así sucesivamente? Ese listado de pares (el número de varones nacidos y el porcentaje sobre el total de las combinaciones con este número) es una distribución aleatoria de probabilidad y su representación gráfica da la famosa campana de Gauss. Lamentablemente, mis conocimientos de estadística son muy escasos y no me bastan para calcular la probabilidad que corresponde a cada número de varones (o la suma de las series con más de 27 varones, en este ejemplo). Pero estoy casi convencido de que se puede determinar. De momento, pues, presumo que esa probabilidad está entre el 11 y el 12%, que es el resultado que le sale a Vanbrugh generando aleatoriamente 365 series (apenas un 0,000000001% de todas las posibles). Sin duda, esa probabilidad será menor que en el hospital con 15 nacimientos, pero nótese que sigue siendo significativa.


Y acabo con la conclusión que me ha motivado escribir este post. A medida que el hospital tenga más nacimientos diarios, la probabilidad de días con mucho desequilibrio disminuirá, ciertamente. Pero en ningún caso desaparecerá. La probabilidad, no ya de que nazca el 60% o más de varones, sino de que todos sean varones siempre existe, por muy alto que sea el número de nacimientos diarios (es siempre una combinación entre todas las posibles). Por tanto, si hay una probabilidad mínima de que todos nazcan varones, hay muchísimas más de que nazcan al menos el 60% de varones. Que en ninguna de las 365 muestras aleatorias de 2.500 nacimientos cada una que ha generado Vanbrugh haya más del 60% de varones no demuestra nada, porque esas 365 muestras son un porcentaje infinitesimal de las combinaciones posibles para 2.500 (2 elevado a 2.500). Es más, por muchas simulaciones que haga Vanbrugh para casos de muchos nacimientos diarios, me temo que casi siempre le saldrán sin días con más del 60% de nacimientos. La razón tiene que ver con una de las propiedades más útiles de las distribuciones normales de frecuencia (las campanas de Gauss, sí), que es que la densidad de casos en torno a la media aumenta inversamente a la desviación estándar de la muestra. Como cuanto mayor sea el número de nacimientos, menor será la desviación estándar de cualquier muestra aleatoria, resultará que, por ejemplo, el intervalo en el que se encuentren el 99,74% de las frecuencias será tanto más cercano al 50% cuanto mayor sea la muestra. Pero aunque en un hospital inmenso la probabilidad de que en un día más del 60% de los nacidos sean varones es mínima, existe. Es más, hay muchísimas combinaciones que cumplen esa condición, cada una de ellas con tantas probabilidades de ocurrir como cualquier otra individual que no cumpla la condición. Improbable, sí, pero si mantenemos un registro durante suficiente tiempo ocurrirá (como experimenté yo con la ruleta).


Addenda: En su comentario a este post, Ozanu ha dado una buena pista, aunque ha escrito erróneamente la fórmula.

En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de resultados dicotómicos independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. A uno de estos resultados se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos.

Los nacimientos sucesivos en un hospital en el periodo de tiempo que se quiera pueden entenderse, en efecto, como una secuencia de ensayos de resultados dicotómicos (o nace niño o nace niña). Si consideramos que el éxito es el nacimiento de un niño (daría igual al revés, claro), lo que se trata es de calcular la probabilidad de un determinado número de éxitos.

La fórmula para determinar la probabilidad de obtener un determinado número m de éxitos en una serie de n ensayos (nacimientos) es: (n!/m!(n–m)!)·pm·(1–p) n–m. El porqué de la expresión está suficientemente bien explicado en el artículo de la wikipedia al que lleva el link aportado por Ozanu.

Aplicando esta fórmula para cualquier tamaño de hospital (medido en número de nacimientos diarios, m), y teniendo en cuenta que el valor de la probabilidad p siempre es 0,5, podemos calcular la probabilidad de que nazcan todos los posibles números de varones, desde 0 hasta m. He pasado esta fórmula a Excel y, como primera medida, he comprobado las probabilidades para m=15; es decir, la tabla que aparece entre los penúltimo y antepenúltimo párrafos del post. Los resultados son exactamente los mismos.

Me habría gustado aplicar la fórmula para un hospital de m = 300 nacimientos diarios (el más grande que se plantea Vanbrugh) pero mi Excel no es capaz de calcular factoriales mayores de 170. A continuación la tabla de las probabilidades de cada uno de los números de nacimientos varones, desde 0 hasta 170:



Como ya dije en el post, la distribución de las frecuencias de los nacimientos se distribuye como una campana de Gauss, bastante más estrecha que en el ejemplo de sólo 15 nacimientos diarios. La probabilidad de que en un día nazcan 102 o más varones (el 60%) es la suma de las probabilidades de los números concretos que, como se recoge en el cuadro final es del 0,5578%, mucho menor que la que salía para un hospital de 15 nacimientos diarios (más del 30%). Por cierto, a través de la distribución binomial se resuelve "matemáticamente" el problema inicial planteado por Vanbrugh.

Vanbrugh, entusiasmado con sus simulaciones, ha seguido un método distinto que le genera unas anomalías cuya explicación espero ansioso. En todo caso, si simulara muuuuchísimos días de nacimientos al azar (mucho antes se lesionaría el dedo o la muñeca) necesariamente las probabilidades de cada número de varones resultaría exactamente el valor de aplicar la fórmula anterior. Y, a medida que aumente n (el número de nacimientos diarios) la probabilidad del porcentaje de varones mayor del 60% tiene que ir disminuyendo. Intuyo que esta probabilidad tiende a cero cuando el número de nacimientos tiende a infinito (en realidad no habría más que calcular el límite de la función de distribución binomial).

Addenda 2: Esta mañana he construido una tabla que calcula la probabilidad de que un hospital con N nacimientos diarios nazcan más de un 60% de varones. Exactamente lo mismo que había hecho Vanbrugh, pero no mediante simulaciones aleatorias al 50%, sino aplicando la fórmula de la distribución binomial. Es decir, las probabilidades que doy para cada tamaño de hospital son a las que llegaría Vanbrugh tras muchas simulaciones. El límite de nacimientos del hospital es de 170, porque a partir de ahí mi Excel no es capaz de calcular el factorial de N.

No voy a poner la tabla, porque es un coñazo pero lo que es importante es que se me confirman los resultados de Vanbrugh. En efecto, como todos intuíamos, a medida que el hospital tiene más nacimientos diarios, baja la probabilidad de alcanzar porcentajes de más del 60% de varones. Sin embargo, este descenso no es lineal sino en forma de diente de sierra. Por ejemplo, la probabilidad de que nazcan más del 60% de varones en un hospital de 30 nacimientos es del 10%, pero en uno de 31 sube al 14,10%, baja en el de 32 al 10,8% (por encima del de 30), vuelve a subir en el de 33 al 14,8% ... Pongo aquí el gráfico para hospitales de 4 a 60 nacimientos para que se aprecie el diente de sierra y cómo la tendencia a medida que aumenta N es la disminución de la probabilidad. En el gráfico del post de Vanbrugh, que llega hasta 300 nacimientos, se aprecia mejor cómo, a medida que N se va haciendo suficientemente grande, el efecto diente de sierra se va atenuando.

Por supuesto no estoy aportando nada nuevo a lo que ya ha escrito Vanbrugh; simplemente, necesitaba verificarlo por mí mismo. Y ahora me encuentro verdaderamente intrigado. ¿A qué se debe tan poco intuitivo comportamiento de la evolución de la probabilidad? Repito: espero ansioso (ahora más) que Vanbrugh nos aclare el misterio. 

17 comentarios:

  1. La probabilidad se calcula como una distribución binomial:

    https://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial

    En este caso, sería:

    P = (N n) * (1/2)^N

    Donde N es el total de recién nacidos y n el número de niños del sexo que se desea conocer.

    ResponderEliminar
    Respuestas
    1. Sí, por ahí van los tiros. Lo empollaré con calma.

      Eliminar
    2. La fórmula está mal, Ozanu. La he comprobado con 15 nacimientos en total y no me daa ni una sola probabilidad correctamente. Sigo estudiando

      Eliminar
    3. La fórmula es:

      P = N!/n!(N-n)!*(1/2)^N

      Eliminar
    4. En eso estoy ahora, Vanbrugh. Pero te has equivocado: Es: P = N!/n!(N-n)!*(1/2)^n*(1/2)^(N-n)

      Eliminar
    5. No me he equivocado.

      (1/2)^n*(1/2)^(N-n) es exactamente lo mismo que (1/2)^N

      El producto de dos potencias con la misma base es una potencia de la misma base elevada a la suma de los exponentes; y n+(N-n) = N

      (Ten en cuenta que estás reproduciendo, en líneas generales, el contenido de mi próximo post, que tengo ya escrito. Te llevo una semana de ventaja).

      Eliminar
    6. Tienes razón; hay que ver lo torpe que estoy. Ciertamente con la expresión general (cuando las probabilidades del éxito y del fracaso no son iguales como en el caso que nos ocupa) no se puede simplificar como correctamente lo has hecho.

      Estoy ahora tratando de hacer la función de la probabilidad de un 60% o más de nacimientos varones en función del tamaño del hospital. Pero no sé por qué coño el Excel me dice que escribo mal la f´órmula SUMAR.SI, que estoy harto de usarla satisfactoriamente en otras tareas. Me temo que tendré que interrumpirme pues he de ir a trabajar.

      Ya supongo que has pasado por estas elucubraciones. Pero ya sabes que, para entender algo, cada uno ha de hacerlas por sí mismo.

      Eliminar
    7. Te comprendo perfectamente. Llevo ya dos fines de semana peleándome con la sintaxis de las funciones de Excel. Tardé más de media hora en darme cuenta de que una hoja no funcionaba porque yo me empeñaba en escribir FACTORIAL en vez de FACT.

      No creo que un blog pueda aspirar a nada mejor que a que sus lectores inteligentes indaguen por su cuenta y a su manera en los asuntos que propone el autor, para llegar a las mismas o a otras conclusiones, eso da igual.

      Eliminar
    8. Alucinado he quedado (la verdad es que me costaba creer tus resultados). Véase Addenda 2. Supongo que ya hablamos de lo mismo. ¿Y tienes la solución al misterio?

      Eliminar
    9. Creo tenerla, que es lo más parecido a tenerla que se da en la realidad.

      Eliminar
  2. Debo hacer dos matices a este estupendo post. Dos matices que encajarían mejor en mi post sobre los nacimientos que en este sobre los números de la ruleta, pero bueno; puesto que has cambiado el campo, no tengo inconveniente en seguirte.

    El primero: tus experimentos ruletísticos no son exactamente iguales que mis consideraciones natalicias. Hay entre ambos una importantísima diferencia. Tú y tu colega necesitabais que los once resultados iguales se produjeran seguidos, o, para ser exactos, necesitabais que NO se produjeran. Pero lo importante es que vuestra fortuna dependía de la probabilidad de que saliera la misma suerte (rojo, impar) once veces consecutivas, sin ninguna interrupción entre una y otra, que os habría bastado para ganar y retiraros. La probabilidad de que tal pase, aunque no nula -como por desgracia comprobaste- es muy baja. Que once tiradas de ruleta seguidas caigan en el mismo color sucede con una probabilidad igual al inverso de 2 elevado a 11, es decir, con el el 0'05% de probabilidad. Puede pasar, pero solo pasa una vez cada dos mil tiradas, como media.

    Mientras que, en mi problema, no hace falta que los nacimientos de niño necesarios para alcanzar el umbral buscado sean consecutivos. No tienen que ser niño los once primeros, o los once últimos, u once de en medio seguidos; basta con que lo sean once cualesquiera del total, aunque entre medias de ellos nazca alguna niña que otra. Y esta diferencia, que parece nimia, sube enormemente la probabilidad. Mientras que en un hospital con doce nacimientos la probabilidad de que once seguidos fueran niños sería del 0'1% (0'05% de que lo fueran los once primeros, más 0'05% de que lo fueran los once últimos), si lo que pedimos al hospital es solo que sean niños, sin importarnos que vayan o no seguidos, como es el caso de nuestro problema, la probabilidad se triplica. Pasa a ser del 0'29 %, exactamente.

    Y esto con un margen tan estrecho como el que va de 11 a 12. En un hospital de trece nacimientos, la diferencia sería aún más grande: del 0'15% para que nazcan seguidos (0'05 los once primeros, más 0'05 los once últimos, más 0'05 los once de enmedio), al 0'95 % para que sean varones once niños cualesquiera, con un par de niñas entre medias, colocadas como más les guste.

    Sin contar con que, como de lo que hablamos es de la probabilidad de alcanzar o superar el umbral buscado, en el caso del hospital habría que sumar, a la probabilidad de que nacieran once varones cualesquiera, la de que nacieran doce varones (en el caso de un hospital de doce) y las de que nacieran doce y trece varones(en el caso del hospital de trece). Pequeñas, pero que algo suman a la probabilidad total.

    O sea, que la probabilidad de alcanzar o superar un número cualquiera de varones no es, en ningún caso, la misma que la de que se produzca ese mismo número de pares, o de rojos, consecutivos en la ruleta, sino muy superior. Se trata, pues, de dos problemas parecidos, pero sustancialmente distintos.

    Y el segundo matiz: como ya te digo en mi post, la campana de Gauss dibuja la distribución de frecuencias con que nace un sexo determinado. Pero mi problema, y mi post, no se refieren a esas frecuencias más que indirectamente. Hablan de otras frecuencias distintas, la de los días en que el nacimiento de un sexo determinado alcanza o supera un determinado umbral, frecuencias que se comportan de una manera muy diferente que las de los nacimientos. Y la distribución de estas otras frecuencias según el número de nacimientos a que se refieran, que es de lo que se ocupa mi post, ni era previsible que dibujara una campana de Gauss ni, como mi post descubre, la dibuja de hecho.

    ResponderEliminar
    Respuestas
    1. Por cierto, mi calculadora no da para calcular la probabilidad de que, de 5.000 nacimientos, el 60%, o sea, 3.000, sean de un sexo determinado. Se declara desbordada por la magnitud (infinitesimal) de las cifras en juego.

      Lo más parecido que me ha permitido calcular es la probabilidad de que, en un hospital de 3.000 nacimientos diarios, el 60%, o sea, 1.800, sean de un sexo determinado. Es, exactamente, de 8'67 por 10 elevado a -29. O, si lo prefieres, del 8'67 por 10 elevado a -27 por ciento. Para los profanos (ya sé que tú no lo eres): del 0'00000000000000000000000000867%.

      No tengo ganas de calcular cuántos miles de billones de años tienen que transcurrir, de acuerdo con esa cifra, antes de que quepa esperar que en un día de ese hospital se produzcan 1.800 nacimientos de un sexo determinado, y solo 1.200 del otro. Pero vienen a ser unos cien cuatrillones de años, bastantes más de los transcurridos, creo, desde el Big Bang.

      En la práctica es a ese género de probabilidades, y a ninguna otra cosa, a lo que llamamos probabilidad 0, creo que con propiedad más que suficiente.

      Eliminar
    2. Perdón lo calculado eran días, claro, no años. Divide la cifra por 365. Sigue dando una buena cantidad de trillones de años.

      Eliminar
    3. Tu problema me recordó mi experiencia personal. Ya sé que no es exactamente lo mismo en cuanto al cálculo. Pero sí tienen una cosa en común y tiene que ver con tu segundo comentario. Creo que es un error pensar que el número de eventos que han de transcurrir (aunque sea por media) para que ocurra uno concreto es la inversa de la probabilidad. A plazo infinito, sí. Pero, en la realidad, las medias valen para poco. Hay que imaginar la distribución de los sexos de los neonatos de un día como un número binario de tantos dígitos como nacimientos (N) se den en el hospital. Ciertamente, hay muchos más números cuyos dígitos suman menos del 60% de N. Pero cada una de esas combinaciones tiene las mismas probabilidades de salir. El azar no sabe que la combinación que ha producido en un día (que, por cierto, no es más que una división convencional de la infinita generación aleatoria de dígitos binarios) está en un grupo con una probabilidad muy baja de salir.

      En cuanto a la distribución de frecuencias de acuerdo a la campana de Gauss sigo pensando que sí es pertinente. Me da o que no me entiendes tú a mí o que (más probable) soy yo el que no termino de entenderte. Así que a ver si consigo un poco de tiempo para meditar más sobre el asunto (supongo que antes leerés tu próximo post).

      Eliminar
    4. Intuyo que estás confundiendo dos fenómenos distintos, Miroslav. Cada vez que la ruleta gira, el rojo tiene un 0'5% de probabilidades de salir, efectivamente, independientemente de cuántas veces seguidas lleve ya saliendo. Nadie, salvo algún que otro jugador obtuso, discute esa evidencia.

      Pero el fenómenos de que salga rojo dos veces seguidas es otro, distinto, con otra probabilidad distinta de la probabilidad de que salga rojo una sola vez. Esta nueva probabilidad se calcula, como sabes, multiplicando entre sí las de las dos cosas que tienen que suceder para que se dé este fenómeno de dos rojos, y por eso vale 0'5 . 0'5 = 0'25.

      De manera que quien apuesta a que slgan once rojos seguidos, o a que no salgan, debe saber que la probabilidad del segundo ya no es de 0'5, sino de 0'25. Y la del tercero, de 0'125... Y la del undécimo, que es contra la que está apostando: la probabilidad, no de que salga rojo esa vez, sino de que salgan once rojos seguidos, es de 0'0005, aproximadamente. No son iguales, en absoluto, como tú mejor que yo has comprobado en directo en el casino.

      Es decir, contra lo que me parece entenderte, no todas las combinaciones tienen las mismas probabilidades de salir. La undécima bola en caer en rojo consecutivamente tiene, de hecho, una probabilidad de hacerlo que es la milésima parte de la de la primera. Por eso hay tan pocas veces -una de cada dos mil, en vez de una de cada dos- en que salga rojo once veces seguidas, mientras que que salga rojo una vez sucede más o menos la mitad de las veces.

      No, no todas las combinaciones tienen las mismas probabilidades de salir. Cada niño que nace tiene, indiscutiblemente, una probabilidad cercana al 50% de ser niño, y lo que le falte hasta 1 a esa probabilidad de ser niña, sí. Pero la combinación de 1.800 niños (ni siquiera digo la de 1.800 niños seguidos, que sería muchísimo menor aún) contra 1.200 niñas no tiene esa misma probabilidad. Tiene una probabilidad tan pequeña de salir que solo sale una vez de cada dos mil y pico trillones de años.

      No hay campana de Gauss que pueda discutir esa afirmación indiscutible.

      Eliminar
    5. Un 0'5 de probabilidad de salir, quise decir en mi primer párrafo, claro, no un 0'5%. Un 50%.

      Eliminar
  3. "El azar no sabe que la combinación que ha producido en un día (que, por cierto, no es más que una división convencional de la infinita generación aleatoria de dígitos binarios) está en un grupo con una probabilidad muy baja de salir".

    Perdóname, Miroslav, pero me parece una afirmación singularmente inane, por decirlo de un modo suave.

    El trozo de hierro caliente tampoco "sabe" que, como su temperatura es mayor, "debe" traspasarle calor al trozo más frío en contacto con él. Ni falta que le hace saberlo, ni al "azar" ni a él. Las leyes físicas, y las estadísticas, no se cumplen porque el universo "sepa" que "debe" cumplirlas. No son leyes en el sentido normativo, ni el Universo las cumple en virtud del mismo mecanismo por el que nosotros acatamos el Derecho. Son nada más el resultado de nuestras observaciones sobre las cosas que pasan en el Universo. No se enuncian para luego ser cumplidas, sino al revés: porque se cumplen podemos enunciarlas luego.

    El azar, efectivamente, no sabe nada sobre cálculo de probabilidades. El cálculo de probabilidades no es más que el resultado de nuestras observaciones sobre lo que hace el azar, suponiendo que haya algo a lo que pueda llamarse así. Precisamente por eso es por lo que funciona.

    Porque, y es a lo que voy, el caso es que funciona. No hay ningún argumento, insisto, que cambie ese dato, y es de él del que debe partir cualquier argumento válido.

    ResponderEliminar