Cuando los números son mágicos
Imagínate una boda. Una de esas con ochenta invitados, comida abundante, primos
que se reencuentran tras una década, un tío que ha bebido más de lo recomendable y
una tía que está convencida de que la pareja no va a durar. En algún momento entre
el segundo plato y el café te levantas, golpeas suavemente la copa con un cuchillo
(clinc-clinc, atención todos), y propones lo siguiente: apuesto cualquier cosa a que dos
personas en esta sala cumplen años el mismo día.
La sala se ríe. Algunos hacen mentalmente la cuenta: ochenta personas, trescientos
sesenta y cinco días, eso es como un veintidós por ciento, ¿qué dice este? El cuñado,
que lo suele saber todo, te mira con esa pena condescendiente que reservan para quien
va a aprender una lección dura. La novia, que es la única que ha bebido menos que
tú, frunce el ceño. Tú insistes. Cualquier cosa. Una ronda de chupitos, la siguiente
cena, el alma de tu primogénito.
Aceptan. Lo que ninguno sabe es que con ochenta personas en la sala, la
probabilidad de que dos compartan cumpleaños es del 99,9914%. En términos
prácticos, ya has ganado. Solo falta encontrarlos.
Esto es la paradoja del cumpleaños (Birthday Paradox), y es de las cosas más bonitas
que tiene la probabilidad. No porque sea complicada, sino porque es exactamente al
revés: es absurdamente sencilla. Veintitrés personas en una sala bastan para que la
probabilidad de cumpleaños compartido cruce el 50%. Con cincuenta y siete pasamos
del 99%. Con setenta, del 99,9%. Y solo necesitamos llegar a 366 para que sea
matemáticamente seguro al cien por cien. En cualquier clase del colegio, en cualquier
reunión de junta directiva con dos dígitos de asistentes, en cualquier cena de empresa
medianamente concurrida, hay cumpleaños duplicado. Es casi seguro.
Lo que tu cerebro hace cuando oye esto por primera vez es algo muy concreto. Se
imagina a sí mismo en la sala, mira a las otras 22 personas, y calcula: “¿qué
probabilidades hay de que alguno de estos 22 cumpla años el mismo día que yo?”. La
respuesta a esa pregunta es, efectivamente, baja: alrededor del 6%. El problema es que
esa no es la pregunta. La pregunta es “si cualquier par de personas en la sala comparte
cumpleaños”. No tú con alguien: cualquier dos. Y aquí es donde la cosa se pone
molona. En una sala de 23 personas no hay 23 comparaciones posibles. Hay 253. Cada
persona se compara con cada otra, y el número de parejas crece muy rápido: con la
fórmula n(n−1)/2, 23 personas generan 253 parejas. Cada una de esas 253 parejas tiene
una probabilidad muy pequeña de coincidir, pero 253 lanzamientos de una moneda
muy sesgada acaban dando cara con bastante facilidad. Pensamos en personas y las
matemáticas te dicen que pienses en parejas. Pensamos en lineal y el universo está
pensando en cuadrático. (¡Magia!)
La paradoja del cumpleaños tiene una historia curiosamente humilde, casi nadie
quiere ser su padre. La primera publicación formal data de 1939 y la firma Richard
von Mises, un matemático austriaco con una vida que daría para una entrada propia:
nació en Lemberg (la actual Lviv ucraniana), fue piloto en la Primera Guerra Mundial,
dirigió el Instituto de Matemáticas Aplicadas de Berlín durante los años 20, huyó del
régimen nazi en 1933 a pesar de haber servido en el ejército austrohúngaro, dio clases
en Estambul, terminó en Harvard como catedrático de aerodinámica, y entre todo eso
encontró tiempo para ser una autoridad mundial en la poesía de Rainer Maria Rilke.
La leyenda dice que se le ocurrió el problema en una fiesta, mientras observaba a los
invitados. Pero von Mises fue el primero en publicarlo, no el primero en pensarlo.
Doce años antes, alrededor de 1927, el matemático británico Harold Davenport ya
había planteado el problema en charlas y conversaciones en Cambridge, sin atreverse
nunca a ponerlo por escrito porque estaba convencido de que aquello era demasiado
bonito para ser nuevo. Sospechaba que alguien, en algún libro polvoriento del siglo
XIX, ya lo habría enunciado. Murió sin saber que probablemente sí era suyo. En fin,
hay tipos de modestia que cuestan caras.
La parte que casi nadie sospecha es que esta idea de fiesta se ha colado en tu vida
digital. Cuando hoy haces una transferencia bancaria, firmas un contrato electrónico
o descargas una actualización de WhatsApp, el sistema que valida que esos datos no
han sido manipulados se llama función hash criptográfica. Su trabajo consiste en
convertir cualquier archivo en una huella digital corta, única para ese archivo. Si
alguien cambia un solo bit, la huella cambia entera. Pero dos archivos distintos no
deberían producir nunca la misma huella, porque entonces un atacante podría
sustituir un contrato firmado por otro fraudulento sin que nadie lo notara. A esa
coincidencia se le llama colisión, y es exactamente lo mismo que dos personas
compartiendo cumpleaños. El ataque que utilizan los hackers para encontrarla se
llama, sin metáforas ni adornos, birthday attack. La razón es matemática pura: si una
función hash genera 128 bits de salida (eso son 2¹²⁸ cumpleaños posibles), un atacante
ingenuo pensaría que necesita probar 2¹²⁸ entradas distintas. Por la paradoja del
cumpleaños, le basta con probar 2⁶⁴, la raíz cuadrada del total. Sigue siendo mucho,
pero es la diferencia entre “imposible” y “podría intentarlo Google si tuviera ganas”.
De hecho, Google las tuvo: en 2017 demostró la primera colisión SHA-1 del mundo,
lo que llevó a la industria a abandonar SHA-1 a marchas forzadas. Es gracioso pensar
en que una idea de fiesta de los años 30 se había comido un protocolo de seguridad
global.
***
Ahora bien, si veintitrés personas en una sala generan 253 pares y eso ya alcanza para
jugar con tu cerebro, qué pasa cuando los elementos crecen un poco más. No mucho.
Solo de 23 a 52. Saca una baraja de 52 cartas y barájala bien. La que tienes ahora
delante, con ese orden exacto, no había existido nunca. Y no volverá a existir. No en
esta sala, ni en este planeta, ni en esta galaxia. Tampoco en este universo. No es
esoterismo: es una multiplicación.
Para saber de cuántas formas se puede ordenar una baraja se hace algo que parece
aburrido, pero da un número maravilloso. Se multiplica 52 por 51, el resultado por
50, el resultado por 49, el resultado por 48 y así hasta llegar al 1. Eso es lo que los
matemáticos llaman el factorial de 52, y lo escriben con un signo de exclamación: 52!.
El número que sale tiene 68 cifras:
80.658.175.170.943.878.571.660.636.856.403.766.975.289.505.440.883.277.82
4.000.000.000.000
Aproximadamente 8 × 10⁶⁷. Decirlo en voz alta no sirve de nada. La cabeza humana
se atasca cuando llega al billón y a partir de ahí es todo “muchísimo”. Hay que entrar
por otra puerta. La que viene a continuación la diseñó hace años un programador
llamado Scott Czepiel y, con datos verificados, sigue siendo la mejor que conozco para
dimensionar 52!. No es eficiente. Es muchas cosas, pero eficiente no.
Vamos a dimensionarlo.
Imagínate un cronómetro encima de la mesa programado para que cuente hacia
atrás 52! segundos. Cada segundo corresponde a un orden diferente de tu baraja de
cartas. Tu trabajo es matar todo ese tiempo. Te plantas en algún punto del ecuador,
cualquiera, y empiezas a caminar. Pero no caminas como caminaríamos tú o yo.
Caminas a un ritmo muy particular: das un paso cada mil millones de años. Sí, lo has
leído perfectamente: 1000 millones de años. Un paso. Mil millones más, otro paso.
Con un ecuador de 40.075 kilómetros y pasos de un metro, completar la primera
vuelta al planeta te lleva unos cuarenta mil billones de años (billones europeos, no los
americanos de nueve ceros: 4 × 10¹⁶). El universo entero, recordemos, tiene 13.800
millones de años. Acabas de tardar tres millones de edades del universo en dar un
paseo alrededor de la Tierra. Y solo es el calentamiento.
Cuando termines la vuelta, te agachas sobre el océano Pacífico y le quitas una gota
de agua. Una. Acto seguido te das la vuelta y empiezas otra vez. Otra circunnavegación
al ritmo geológico, otra gota fuera del Pacífico cuando termines. El Pacífico tiene 707
millones de kilómetros cúbicos de agua, así que ahí dentro hay del orden de 1,4 × 10²⁵
gotas, y vas a sacarlas todas, una por vuelta. Si dentro de unos cuantos eones algún
oceanógrafo del futuro detecta que el nivel del Pacífico está bajando un picómetro
cada cuarenta mil billones de años, ese serás tú.
Pasan los milenios, los millones de años, las eras geológicas. Pasan, en realidad,
escalas de tiempo para las que ni siquiera existe palabra. Pero un día, después de
muchísimas vueltas, miras hacia abajo y ves el lecho del Pacífico al descubierto. Lo
has secado. Vacío. Ese día tienes derecho a una recompensa, y la recompensa es esta:
dejas en el suelo una hoja de papel. Una. De las finas. 0,1 milímetros. Después rellenas
el océano (no me preguntes de qué, es tu problema) y vuelves a empezar. Otro Pacífico
vaciado, otra hoja sobre la primera. Empiezas a formar una pila. La pila tiene un
destino: el Sol. Cuando la torre de papel mida 149,6 millones de kilómetros y la
primera hoja toque la fotosfera, podrás detenerte. Te van a hacer falta unos 1.500
billones de hojas. Cada hoja te ha costado vaciar el Pacífico una vez, y cada Pacífico
te ha costado dar gota a gota la vuelta entera al planeta a un paso por eón.
Una hoja por Pacífico. Conviene no pensarlo demasiado.
El día que la última hoja se desintegre suavemente al rozar el Sol, miras el
cronómetro. Te recuerdo que arrancaste en 8,066 × 10⁶⁷ segundos. Mírala bien. La
cifra que te devuelve ahora es 8,063 × 10⁶⁷ segundos. Las tres primeras cifras siguen
iguales. Llevas, en términos prácticos, sin empezar. La pila entera de papel hasta el
Sol, levantada gota a gota desde el océano más grande del planeta a un paso por eón,
te ha consumido apenas un 0,033% del tiempo total. Tres centésimas de un uno por
ciento. Una diezmilésima.
Toca repetir. La operación completa (Pacífico, hoja, Sol, Pacífico, hoja, Sol), mil
veces más. Mil torres de papel del tamaño de la unidad astronómica, levantadas a base
de drenar el océano más grande de la Tierra a paso geológico. Y solo cuando la
milésima torre se evapore en el plasma solar, el cronómetro habrá descontado un
tercio del tiempo. Te quedan dos. Mil pilas de papel hasta el Sol y vas por el primer
acto de tres.
Eso es 52!. La cantidad de órdenes posibles de un mazo de cartas que cabe en un
bolsillo trasero. Si todos los humanos que han pisado la Tierra (los 117.000 millones
que el Population Reference Bureau calcu la desde el origen de la especie) hubieran
estado barajando una baraja por segundo, sin parar, desde el Big Bang hace 13.800
millones de años, hoy llevarían apenas 5 × 10²⁸ combinaciones generadas. A 52! le
seguiría faltando un factor de 10³⁹ para alcanzarse. Treinta y nueve órdenes de
magnitud por encima de un esfuerzo cósmico colectivo. La humanidad entera
barajando desde antes de que existieran las estrellas y aún no hemos arrancado. Y por
si esto no fuera poco para explotarte la cabeza, te doy otro detalle: si existen 8 × 10⁶⁷
posibilidades, ¿cuántas veces tendrás que mezclar la baraja para llegar a una posición
verdaderamente aleatoria? Intuitivamente, muchas. Quizá miles. Quizá millones. La
respuesta es siete.
La dio en 1992 un matemático llamado Persi Diaconis, junto con su colega Dave
Bayer, en un artículo con uno de los títulos más bonitos de la literatura académica:
Trailing the Dovetail Shuffle to Its Lair. Persiguiendo al barajeo de cascada hasta su
madriguera. La frase no era suya. La había acuñado a principios del siglo XX un
cartomago llamado Charles Jordan que hoy nadie recuerda. Que un catedrático de
Stanford homenajeara a un mago olvidado en el título de su paper más citado tiene
sentido, porque resulta que Diaconis fue cartomago profesional antes que
matemático. Y, técnicamente, todavía lo es. A los 14 años, en vez de estudiar, pasaba
las tardes en Tannen’s Magic Store, en pleno Times Square, donde los magos de Nueva
York se reunían a enseñarse trucos. Una de aquellas tardes se le acercó Dai Vernon,
un canadiense bajito y encantador al que el gremio llamaba “el hombre que engañó a
Houdini” y al que sus colegas consideraban, sin ironía, el Einstein de la cartomagia.
Vernon le pidió que le enseñara lo que sabía hacer con las cartas. Persi, con catorce
años, se las enseñó. Dos días después le sonó el teléfono. Era Vernon. “Quedamos
pasado mañana a las dos en la West Side Highway. Vente de gira.”
Persi hizo la maleta y se fue sin avisar a sus padres. Pasó la siguiente década
recorriendo barcos transatlánticos entre Nueva York y Sudamérica, haciendo
cartomagia por las noches y desplumando a los pasajeros en partidas de póker en las
que nadie sospechaba del adolescente. A los 24 decidió que las matemáticas que había
detrás de las cartas le interesaban más que las cartas, y se apuntó a clases nocturnas en
el City College de Nueva York pagándose la matrícula con sus shows. Llegó a Harvard
porque Martin Gardner, el legendario columnista de Scientific American y mago
aficionado, le escribió a la facultad una carta que decía, más o menos, que ese chaval
había inventado dos de los diez mejores trucos de cartas de la última década, y que le
dieran una oportunidad. En Harvard, eso era criterio suficiente. Doctorado en
estadística en 1974, cátedra en Stanford, beca MacArthur en 1982. Lleva décadas
estudiando lo que pasa cuando barajas, lo que pasa cuando lanzas una moneda al aire
(resultado: si la lanzas con cara arriba, cae cara el 51% de las veces), y lo que pasa
cuando un falso psíquico se cree que va a engañarle. En 1992, lo que él y Bayer
demostraron es que con seis pasadas de cascada (el barajeo normal de toda la vida) la
baraja todavía recuerda demasiado su orden inicial. Con siete, ya no. Pasas, en treinta
segundos, de un mazo recién comprado a un mazo indistinguible de cualquiera de los
8 × 10⁶⁷ órdenes posibles. La aleatoriedad llega rápido, cuando el caos es profundo.
***
Hasta aquí hemos visto que nuestro cerebro no está acostumbrado a entender según
qué magnitudes. Veintitrés personas se sienten poco aunque generen 253 pares.
Cincuenta y dos cartas se sienten manejables aunque generen una galaxia de
combinaciones. Pero hay algo todavía más raro, una capa más profunda de
equivocación, y tiene que ver no con cuántos números hay sino con cómo son los
propios números cuando los miras de cerca.
Coge una factura cualquiera. Una nómina. La cifra de habitantes de tu pueblo. La
distancia que has hecho en coche este año. Las cotizaciones de cierre del IBEX en el
último mes. El precio de los apartamentos en el portal inmobiliario. Cualquier
conjunto de números que vengan del mundo real. Apunta el primer dígito de cada
uno (no el más significativo en términos de magnitud, sino el primero que aparece
escrito) y haz un recuento. El reparto justo sería sencillo: nueve dígitos del 1 al 9, cada
uno apareciendo una de cada nueve veces. Un 11,1%. Demócrata.
Pues no. En cualquier conjunto suficientemente grande de números del mundo
real, el dígito 1 aparece como primera cifra el 30,1% de las veces. El 2, un 17,6%. El 3,
un 12,5%. El 9, apenas un 4,6%. El uno aparece casi siete veces más que el nueve. No
es una pequeña desviación: es una proporción descomunal, sistemática, y aparece
donde no tiene ningún derecho a aparecer.
A este patrón se le llama ley de Benford y la descubrió en 1881 un astrónomo
canadiense-americano llamado Simon Newcomb, en una de las observaciones más
casuales de la historia de la ciencia. Antes de que existieran las calculadoras
electrónicas, los científicos hacían cálculos consultando libros de tablas de logaritmos,
tomos enormes con cientos de páginas de cifras. Newcomb se fijó un día en un detalle
aparentemente trivial: en su biblioteca, las primeras páginas de los libros de
logaritmos (las que correspondían a números que empezaban por 1) estaban
significativamente más sucias y desgastadas que las últimas (las del 8 y el 9). La gente
las consultaba mucho más. Newcomb dedujo que los números empezados por dígitos
pequeños debían aparecer más en la naturaleza, calculó la distribución, publicó un
artículo de dos páginas en el American Journal of Mathematics y se fue a hacer otras
cosas. Nadie le hizo caso.
Cincuenta y siete años después, en 1938, un físico de General Electric llamado
Frank Benford observó exactamente lo mismo, también con tablas de logaritmos
manchadas, y decidió hacer algo más serio: recopiló más de 20.000 cifras tomadas de
veinte fuentes completamente distintas. Las superficies de 335 ríos. Los habitantes de
3.259 ciudades de Estados Unidos. 104 constantes físicas. 1.800 pesos moleculares. 308
números aparecidos en un ejemplar de Reader’s Digest. Las direcciones postales de las
primeras 342 personas que aparecían en American Men of Science. 418 tasas de
mortalidad. Y en todas esas listas, sin excepciones llamativas, salió la misma curva: el
1 mandando con un 30%, decreciendo hasta el 9. Su artículo se llamó The Law of
Anomalous Numbers. La ley se conoce desde entonces por su apellido, no por el de
Newcomb, en un ejemplo perfecto de la ley de Stigler, según la cual ningún
descubrimiento científico lleva el nombre de su descubridor. (La ley de Stigler, dicho
sea de paso, no la descubrió Stigler.)
¿Por qué pasa esto? La explicación corta es que la mayoría de los datos del mundo
real no se distribuyen linealmente, sino logarítmicamente. Crecen multiplicándose.
Una población que crece al 4% anual tarda mucho más en pasar de 1.000 a 2.000
(necesita duplicarse) que de 8.000 a 9.000 (un mero 12,5% más). Por tanto, vivirá
mucho más tiempo con un 1 delante que con un 9. Y como esto se reinicia en cada
orden de magnitud (de 10.000 a 20.000 vuelve a costar duplicarse), el 1 acumula
tiempo, y aparece más. Hay también una propiedad bonita detrás, llamada invariancia
de escala: si una distribución de números cumple la ley de Benford, sigue
cumpliéndola cuando cambias las unidades. Mide los ríos en kilómetros, en millas,
en codos egipcios o en la longitud del pie izquierdo de Carlomagno. La distribución
del primer dígito no se mueve. Y resulta que solo hay una distribución posible que
tenga esa propiedad, y es exactamente la que Newcomb y Benford observaron.
¿Y esto para qué me sirve?
Pues, lo que tendría que ser un pasatiempo matemático se ha convertido en una
herramienta forense seria. Cuando alguien se inventa números (un asesor financiero
falsificando informes, una empresa hinchando facturas, un gobierno maquillando
estadísticas oficiales, un país inventando resultados electorales) tiende a distribuir los
primeros dígitos de manera aproximadamente uniforme, porque su intuición
humana le dice que así es como se ven los números aleatorios. Pero los números reales
no son uniformes. Son Benford. Cualquier conjunto de cifras presuntamente
naturales cuya primera cifra se reparta más o menos por igual entre los nueve dígitos
es, en el mejor de los casos, sospechoso. En 1972 el economista Hal Varian propuso
usar este principio para detectar fraude en datos socioeconómicos. En los años 90, el
contable Mark Nigrini lo introdujo en la auditoría forense, y desde entonces se aplica
de forma rutinaria por Hacienda, por las Big Four y por cualquier despacho que
examine balances con sospecha. El asesor financiero Wesley Rhodes acabó condenado
por fraude en parte porque sus documentos no cumplían Benford. La informática
Jennifer Golbeck lo usó para destapar redes de bots rusos en Twitter. Diversos estudios
académicos lo han aplicado a las elecciones iraníes de 2009 y a las cuentas que Grecia
presentó a la Unión Europea antes de la crisis, con resultados llamativos en ambos
casos. Los números, cuando se los miras desde lejos, no son un montón inerte de
cifras. Tienen huellas dactilares.
***
Hay un patrón común en estas tres curiosidades, y vale la pena pararse a verlo. Tu
cerebro evolucionó durante millones de años para resolver problemas muy concretos:
contar miembros del clan, recordar dónde había agua, calcular si la cabra que se acerca
por la izquierda llega antes que la pareja que se acerca por la derecha. Vivimos en
grupos pequeños, en muestras pequeñas, en escalas humanas. Nadie en el Pleistoceno
necesitaba intuir cuántos pares se forman con 23 personas, ni cómo se distribuyen los
primeros dígitos de las longitudes de los ríos, ni cómo escala el factorial de un número
modesto. Eran problemas que no existían. Y por eso la maquinaria que tenemos para
pensarlos sigue siendo, esencialmente, la misma de aquel cazador frente a su fuego:
lineal, intuitiva, mal preparada para la combinatoria, ciega ante los logaritmos.
Las matemáticas, vistas desde aquí, no son una asignatura abstracta. Son las gafas
correctoras que la evolución no nos dio. Sin ellas, una boda de ochenta personas
parece un escenario donde nadie compartirá cumpleaños, una baraja en la mano
parece un objeto trivial, y una contabilidad falsa parece una contabilidad cualquiera.
Con ellas, ganas la apuesta, te asomas al universo entero a través de un mazo de cartas,
y descubres que un 1 que aparece demasiado puede mandar a alguien a la cárcel.
Conviene aprender a usarlas.
Cuando los números son mágicos
Imagínate una boda. Una de esas con ochenta invitados, comida abundante, primos
que se reencuentran tras una década, un tío que ha bebido más de lo recomendable y
una tía que está convencida de que la pareja no va a durar. En algún momento entre
el segundo plato y el café te levantas, golpeas suavemente la copa con un cuchillo
(clinc-clinc, atención todos), y propones lo siguiente: apuesto cualquier cosa a que dos
personas en esta sala cumplen años el mismo día.
La sala se ríe. Algunos hacen mentalmente la cuenta: ochenta personas, trescientos
sesenta y cinco días, eso es como un veintidós por ciento, ¿qué dice este? El cuñado,
que lo suele saber todo, te mira con esa pena condescendiente que reservan para quien
va a aprender una lección dura. La novia, que es la única que ha bebido menos que
tú, frunce el ceño. Tú insistes. Cualquier cosa. Una ronda de chupitos, la siguiente
cena, el alma de tu primogénito.
Aceptan. Lo que ninguno sabe es que con ochenta personas en la sala, la
probabilidad de que dos compartan cumpleaños es del 99,9914%. En términos
prácticos, ya has ganado. Solo falta encontrarlos.
Esto es la paradoja del cumpleaños (Birthday Paradox), y es de las cosas más bonitas
que tiene la probabilidad. No porque sea complicada, sino porque es exactamente al
revés: es absurdamente sencilla. Veintitrés personas en una sala bastan para que la
probabilidad de cumpleaños compartido cruce el 50%. Con cincuenta y siete pasamos
del 99%. Con setenta, del 99,9%. Y solo necesitamos llegar a 366 para que sea
matemáticamente seguro al cien por cien. En cualquier clase del colegio, en cualquier
reunión de junta directiva con dos dígitos de asistentes, en cualquier cena de empresa
medianamente concurrida, hay cumpleaños duplicado. Es casi seguro.
Lo que tu cerebro hace cuando oye esto por primera vez es algo muy concreto. Se
imagina a sí mismo en la sala, mira a las otras 22 personas, y calcula: “¿qué
probabilidades hay de que alguno de estos 22 cumpla años el mismo día que yo?”. La
respuesta a esa pregunta es, efectivamente, baja: alrededor del 6%. El problema es que
esa no es la pregunta. La pregunta es “si cualquier par de personas en la sala comparte
cumpleaños”. No tú con alguien: cualquier dos. Y aquí es donde la cosa se pone
molona. En una sala de 23 personas no hay 23 comparaciones posibles. Hay 253. Cada
persona se compara con cada otra, y el número de parejas crece muy rápido: con la
fórmula n(n−1)/2, 23 personas generan 253 parejas. Cada una de esas 253 parejas tiene
una probabilidad muy pequeña de coincidir, pero 253 lanzamientos de una moneda
muy sesgada acaban dando cara con bastante facilidad. Pensamos en personas y las
matemáticas te dicen que pienses en parejas. Pensamos en lineal y el universo está
pensando en cuadrático. (¡Magia!)
La paradoja del cumpleaños tiene una historia curiosamente humilde, casi nadie
quiere ser su padre. La primera publicación formal data de 1939 y la firma Richard
von Mises, un matemático austriaco con una vida que daría para una entrada propia:
nació en Lemberg (la actual Lviv ucraniana), fue piloto en la Primera Guerra Mundial,
dirigió el Instituto de Matemáticas Aplicadas de Berlín durante los años 20, huyó del
régimen nazi en 1933 a pesar de haber servido en el ejército austrohúngaro, dio clases
en Estambul, terminó en Harvard como catedrático de aerodinámica, y entre todo eso
encontró tiempo para ser una autoridad mundial en la poesía de Rainer Maria Rilke.
La leyenda dice que se le ocurrió el problema en una fiesta, mientras observaba a los
invitados. Pero von Mises fue el primero en publicarlo, no el primero en pensarlo.
Doce años antes, alrededor de 1927, el matemático británico Harold Davenport ya
había planteado el problema en charlas y conversaciones en Cambridge, sin atreverse
nunca a ponerlo por escrito porque estaba convencido de que aquello era demasiado
bonito para ser nuevo. Sospechaba que alguien, en algún libro polvoriento del siglo
XIX, ya lo habría enunciado. Murió sin saber que probablemente sí era suyo. En fin,
hay tipos de modestia que cuestan caras.
La parte que casi nadie sospecha es que esta idea de fiesta se ha colado en tu vida
digital. Cuando hoy haces una transferencia bancaria, firmas un contrato electrónico
o descargas una actualización de WhatsApp, el sistema que valida que esos datos no
han sido manipulados se llama función hash criptográfica. Su trabajo consiste en
convertir cualquier archivo en una huella digital corta, única para ese archivo. Si
alguien cambia un solo bit, la huella cambia entera. Pero dos archivos distintos no
deberían producir nunca la misma huella, porque entonces un atacante podría
sustituir un contrato firmado por otro fraudulento sin que nadie lo notara. A esa
coincidencia se le llama colisión, y es exactamente lo mismo que dos personas
compartiendo cumpleaños. El ataque que utilizan los hackers para encontrarla se
llama, sin metáforas ni adornos, birthday attack. La razón es matemática pura: si una
función hash genera 128 bits de salida (eso son 2¹²⁸ cumpleaños posibles), un atacante
ingenuo pensaría que necesita probar 2¹²⁸ entradas distintas. Por la paradoja del
cumpleaños, le basta con probar 2⁶⁴, la raíz cuadrada del total. Sigue siendo mucho,
pero es la diferencia entre “imposible” y “podría intentarlo Google si tuviera ganas”.
De hecho, Google las tuvo: en 2017 demostró la primera colisión SHA-1 del mundo,
lo que llevó a la industria a abandonar SHA-1 a marchas forzadas. Es gracioso pensar
en que una idea de fiesta de los años 30 se había comido un protocolo de seguridad
global.
***
Ahora bien, si veintitrés personas en una sala generan 253 pares y eso ya alcanza para
jugar con tu cerebro, qué pasa cuando los elementos crecen un poco más. No mucho.
Solo de 23 a 52. Saca una baraja de 52 cartas y barájala bien. La que tienes ahora
delante, con ese orden exacto, no había existido nunca. Y no volverá a existir. No en
esta sala, ni en este planeta, ni en esta galaxia. Tampoco en este universo. No es
esoterismo: es una multiplicación.
Para saber de cuántas formas se puede ordenar una baraja se hace algo que parece
aburrido, pero da un número maravilloso. Se multiplica 52 por 51, el resultado por
50, el resultado por 49, el resultado por 48 y así hasta llegar al 1. Eso es lo que los
matemáticos llaman el factorial de 52, y lo escriben con un signo de exclamación: 52!.
El número que sale tiene 68 cifras:
80.658.175.170.943.878.571.660.636.856.403.766.975.289.505.440.883.277.82
4.000.000.000.000
Aproximadamente 8 × 10⁶⁷. Decirlo en voz alta no sirve de nada. La cabeza humana
se atasca cuando llega al billón y a partir de ahí es todo “muchísimo”. Hay que entrar
por otra puerta. La que viene a continuación la diseñó hace años un programador
llamado Scott Czepiel y, con datos verificados, sigue siendo la mejor que conozco para
dimensionar 52!. No es eficiente. Es muchas cosas, pero eficiente no.
Vamos a dimensionarlo.
Imagínate un cronómetro encima de la mesa programado para que cuente hacia
atrás 52! segundos. Cada segundo corresponde a un orden diferente de tu baraja de
cartas. Tu trabajo es matar todo ese tiempo. Te plantas en algún punto del ecuador,
cualquiera, y empiezas a caminar. Pero no caminas como caminaríamos tú o yo.
Caminas a un ritmo muy particular: das un paso cada mil millones de años. Sí, lo has
leído perfectamente: 1000 millones de años. Un paso. Mil millones más, otro paso.
Con un ecuador de 40.075 kilómetros y pasos de un metro, completar la primera
vuelta al planeta te lleva unos cuarenta mil billones de años (billones europeos, no los
americanos de nueve ceros: 4 × 10¹⁶). El universo entero, recordemos, tiene 13.800
millones de años. Acabas de tardar tres millones de edades del universo en dar un
paseo alrededor de la Tierra. Y solo es el calentamiento.
Cuando termines la vuelta, te agachas sobre el océano Pacífico y le quitas una gota
de agua. Una. Acto seguido te das la vuelta y empiezas otra vez. Otra circunnavegación
al ritmo geológico, otra gota fuera del Pacífico cuando termines. El Pacífico tiene 707
millones de kilómetros cúbicos de agua, así que ahí dentro hay del orden de 1,4 × 10²⁵
gotas, y vas a sacarlas todas, una por vuelta. Si dentro de unos cuantos eones algún
oceanógrafo del futuro detecta que el nivel del Pacífico está bajando un picómetro
cada cuarenta mil billones de años, ese serás tú.
Pasan los milenios, los millones de años, las eras geológicas. Pasan, en realidad,
escalas de tiempo para las que ni siquiera existe palabra. Pero un día, después de
muchísimas vueltas, miras hacia abajo y ves el lecho del Pacífico al descubierto. Lo
has secado. Vacío. Ese día tienes derecho a una recompensa, y la recompensa es esta:
dejas en el suelo una hoja de papel. Una. De las finas. 0,1 milímetros. Después rellenas
el océano (no me preguntes de qué, es tu problema) y vuelves a empezar. Otro Pacífico
vaciado, otra hoja sobre la primera. Empiezas a formar una pila. La pila tiene un
destino: el Sol. Cuando la torre de papel mida 149,6 millones de kilómetros y la
primera hoja toque la fotosfera, podrás detenerte. Te van a hacer falta unos 1.500
billones de hojas. Cada hoja te ha costado vaciar el Pacífico una vez, y cada Pacífico
te ha costado dar gota a gota la vuelta entera al planeta a un paso por eón.
Una hoja por Pacífico. Conviene no pensarlo demasiado.
El día que la última hoja se desintegre suavemente al rozar el Sol, miras el
cronómetro. Te recuerdo que arrancaste en 8,066 × 10⁶⁷ segundos. Mírala bien. La
cifra que te devuelve ahora es 8,063 × 10⁶⁷ segundos. Las tres primeras cifras siguen
iguales. Llevas, en términos prácticos, sin empezar. La pila entera de papel hasta el
Sol, levantada gota a gota desde el océano más grande del planeta a un paso por eón,
te ha consumido apenas un 0,033% del tiempo total. Tres centésimas de un uno por
ciento. Una diezmilésima.
Toca repetir. La operación completa (Pacífico, hoja, Sol, Pacífico, hoja, Sol), mil
veces más. Mil torres de papel del tamaño de la unidad astronómica, levantadas a base
de drenar el océano más grande de la Tierra a paso geológico. Y solo cuando la
milésima torre se evapore en el plasma solar, el cronómetro habrá descontado un
tercio del tiempo. Te quedan dos. Mil pilas de papel hasta el Sol y vas por el primer
acto de tres.
Eso es 52!. La cantidad de órdenes posibles de un mazo de cartas que cabe en un
bolsillo trasero. Si todos los humanos que han pisado la Tierra (los 117.000 millones
que el Population Reference Bureau calcu la desde el origen de la especie) hubieran
estado barajando una baraja por segundo, sin parar, desde el Big Bang hace 13.800
millones de años, hoy llevarían apenas 5 × 10²⁸ combinaciones generadas. A 52! le
seguiría faltando un factor de 10³⁹ para alcanzarse. Treinta y nueve órdenes de
magnitud por encima de un esfuerzo cósmico colectivo. La humanidad entera
barajando desde antes de que existieran las estrellas y aún no hemos arrancado. Y por
si esto no fuera poco para explotarte la cabeza, te doy otro detalle: si existen 8 × 10⁶⁷
posibilidades, ¿cuántas veces tendrás que mezclar la baraja para llegar a una posición
verdaderamente aleatoria? Intuitivamente, muchas. Quizá miles. Quizá millones. La
respuesta es siete.
La dio en 1992 un matemático llamado Persi Diaconis, junto con su colega Dave
Bayer, en un artículo con uno de los títulos más bonitos de la literatura académica:
Trailing the Dovetail Shuffle to Its Lair. Persiguiendo al barajeo de cascada hasta su
madriguera. La frase no era suya. La había acuñado a principios del siglo XX un
cartomago llamado Charles Jordan que hoy nadie recuerda. Que un catedrático de
Stanford homenajeara a un mago olvidado en el título de su paper más citado tiene
sentido, porque resulta que Diaconis fue cartomago profesional antes que
matemático. Y, técnicamente, todavía lo es. A los 14 años, en vez de estudiar, pasaba
las tardes en Tannen’s Magic Store, en pleno Times Square, donde los magos de Nueva
York se reunían a enseñarse trucos. Una de aquellas tardes se le acercó Dai Vernon,
un canadiense bajito y encantador al que el gremio llamaba “el hombre que engañó a
Houdini” y al que sus colegas consideraban, sin ironía, el Einstein de la cartomagia.
Vernon le pidió que le enseñara lo que sabía hacer con las cartas. Persi, con catorce
años, se las enseñó. Dos días después le sonó el teléfono. Era Vernon. “Quedamos
pasado mañana a las dos en la West Side Highway. Vente de gira.”
Persi hizo la maleta y se fue sin avisar a sus padres. Pasó la siguiente década
recorriendo barcos transatlánticos entre Nueva York y Sudamérica, haciendo
cartomagia por las noches y desplumando a los pasajeros en partidas de póker en las
que nadie sospechaba del adolescente. A los 24 decidió que las matemáticas que había
detrás de las cartas le interesaban más que las cartas, y se apuntó a clases nocturnas en
el City College de Nueva York pagándose la matrícula con sus shows. Llegó a Harvard
porque Martin Gardner, el legendario columnista de Scientific American y mago
aficionado, le escribió a la facultad una carta que decía, más o menos, que ese chaval
había inventado dos de los diez mejores trucos de cartas de la última década, y que le
dieran una oportunidad. En Harvard, eso era criterio suficiente. Doctorado en
estadística en 1974, cátedra en Stanford, beca MacArthur en 1982. Lleva décadas
estudiando lo que pasa cuando barajas, lo que pasa cuando lanzas una moneda al aire
(resultado: si la lanzas con cara arriba, cae cara el 51% de las veces), y lo que pasa
cuando un falso psíquico se cree que va a engañarle. En 1992, lo que él y Bayer
demostraron es que con seis pasadas de cascada (el barajeo normal de toda la vida) la
baraja todavía recuerda demasiado su orden inicial. Con siete, ya no. Pasas, en treinta
segundos, de un mazo recién comprado a un mazo indistinguible de cualquiera de los
8 × 10⁶⁷ órdenes posibles. La aleatoriedad llega rápido, cuando el caos es profundo.
***
Hasta aquí hemos visto que nuestro cerebro no está acostumbrado a entender según
qué magnitudes. Veintitrés personas se sienten poco aunque generen 253 pares.
Cincuenta y dos cartas se sienten manejables aunque generen una galaxia de
combinaciones. Pero hay algo todavía más raro, una capa más profunda de
equivocación, y tiene que ver no con cuántos números hay sino con cómo son los
propios números cuando los miras de cerca.
Coge una factura cualquiera. Una nómina. La cifra de habitantes de tu pueblo. La
distancia que has hecho en coche este año. Las cotizaciones de cierre del IBEX en el
último mes. El precio de los apartamentos en el portal inmobiliario. Cualquier
conjunto de números que vengan del mundo real. Apunta el primer dígito de cada
uno (no el más significativo en términos de magnitud, sino el primero que aparece
escrito) y haz un recuento. El reparto justo sería sencillo: nueve dígitos del 1 al 9, cada
uno apareciendo una de cada nueve veces. Un 11,1%. Demócrata.
Pues no. En cualquier conjunto suficientemente grande de números del mundo
real, el dígito 1 aparece como primera cifra el 30,1% de las veces. El 2, un 17,6%. El 3,
un 12,5%. El 9, apenas un 4,6%. El uno aparece casi siete veces más que el nueve. No
es una pequeña desviación: es una proporción descomunal, sistemática, y aparece
donde no tiene ningún derecho a aparecer.
A este patrón se le llama ley de Benford y la descubrió en 1881 un astrónomo
canadiense-americano llamado Simon Newcomb, en una de las observaciones más
casuales de la historia de la ciencia. Antes de que existieran las calculadoras
electrónicas, los científicos hacían cálculos consultando libros de tablas de logaritmos,
tomos enormes con cientos de páginas de cifras. Newcomb se fijó un día en un detalle
aparentemente trivial: en su biblioteca, las primeras páginas de los libros de
logaritmos (las que correspondían a números que empezaban por 1) estaban
significativamente más sucias y desgastadas que las últimas (las del 8 y el 9). La gente
las consultaba mucho más. Newcomb dedujo que los números empezados por dígitos
pequeños debían aparecer más en la naturaleza, calculó la distribución, publicó un
artículo de dos páginas en el American Journal of Mathematics y se fue a hacer otras
cosas. Nadie le hizo caso.
Cincuenta y siete años después, en 1938, un físico de General Electric llamado
Frank Benford observó exactamente lo mismo, también con tablas de logaritmos
manchadas, y decidió hacer algo más serio: recopiló más de 20.000 cifras tomadas de
veinte fuentes completamente distintas. Las superficies de 335 ríos. Los habitantes de
3.259 ciudades de Estados Unidos. 104 constantes físicas. 1.800 pesos moleculares. 308
números aparecidos en un ejemplar de Reader’s Digest. Las direcciones postales de las
primeras 342 personas que aparecían en American Men of Science. 418 tasas de
mortalidad. Y en todas esas listas, sin excepciones llamativas, salió la misma curva: el
1 mandando con un 30%, decreciendo hasta el 9. Su artículo se llamó The Law of
Anomalous Numbers. La ley se conoce desde entonces por su apellido, no por el de
Newcomb, en un ejemplo perfecto de la ley de Stigler, según la cual ningún
descubrimiento científico lleva el nombre de su descubridor. (La ley de Stigler, dicho
sea de paso, no la descubrió Stigler.)
¿Por qué pasa esto? La explicación corta es que la mayoría de los datos del mundo
real no se distribuyen linealmente, sino logarítmicamente. Crecen multiplicándose.
Una población que crece al 4% anual tarda mucho más en pasar de 1.000 a 2.000
(necesita duplicarse) que de 8.000 a 9.000 (un mero 12,5% más). Por tanto, vivirá
mucho más tiempo con un 1 delante que con un 9. Y como esto se reinicia en cada
orden de magnitud (de 10.000 a 20.000 vuelve a costar duplicarse), el 1 acumula
tiempo, y aparece más. Hay también una propiedad bonita detrás, llamada invariancia
de escala: si una distribución de números cumple la ley de Benford, sigue
cumpliéndola cuando cambias las unidades. Mide los ríos en kilómetros, en millas,
en codos egipcios o en la longitud del pie izquierdo de Carlomagno. La distribución
del primer dígito no se mueve. Y resulta que solo hay una distribución posible que
tenga esa propiedad, y es exactamente la que Newcomb y Benford observaron.
¿Y esto para qué me sirve?
Pues, lo que tendría que ser un pasatiempo matemático se ha convertido en una
herramienta forense seria. Cuando alguien se inventa números (un asesor financiero
falsificando informes, una empresa hinchando facturas, un gobierno maquillando
estadísticas oficiales, un país inventando resultados electorales) tiende a distribuir los
primeros dígitos de manera aproximadamente uniforme, porque su intuición
humana le dice que así es como se ven los números aleatorios. Pero los números reales
no son uniformes. Son Benford. Cualquier conjunto de cifras presuntamente
naturales cuya primera cifra se reparta más o menos por igual entre los nueve dígitos
es, en el mejor de los casos, sospechoso. En 1972 el economista Hal Varian propuso
usar este principio para detectar fraude en datos socioeconómicos. En los años 90, el
contable Mark Nigrini lo introdujo en la auditoría forense, y desde entonces se aplica
de forma rutinaria por Hacienda, por las Big Four y por cualquier despacho que
examine balances con sospecha. El asesor financiero Wesley Rhodes acabó condenado
por fraude en parte porque sus documentos no cumplían Benford. La informática
Jennifer Golbeck lo usó para destapar redes de bots rusos en Twitter. Diversos estudios
académicos lo han aplicado a las elecciones iraníes de 2009 y a las cuentas que Grecia
presentó a la Unión Europea antes de la crisis, con resultados llamativos en ambos
casos. Los números, cuando se los miras desde lejos, no son un montón inerte de
cifras. Tienen huellas dactilares.
***
Hay un patrón común en estas tres curiosidades, y vale la pena pararse a verlo. Tu
cerebro evolucionó durante millones de años para resolver problemas muy concretos:
contar miembros del clan, recordar dónde había agua, calcular si la cabra que se acerca
por la izquierda llega antes que la pareja que se acerca por la derecha. Vivimos en
grupos pequeños, en muestras pequeñas, en escalas humanas. Nadie en el Pleistoceno
necesitaba intuir cuántos pares se forman con 23 personas, ni cómo se distribuyen los
primeros dígitos de las longitudes de los ríos, ni cómo escala el factorial de un número
modesto. Eran problemas que no existían. Y por eso la maquinaria que tenemos para
pensarlos sigue siendo, esencialmente, la misma de aquel cazador frente a su fuego:
lineal, intuitiva, mal preparada para la combinatoria, ciega ante los logaritmos.
Las matemáticas, vistas desde aquí, no son una asignatura abstracta. Son las gafas
correctoras que la evolución no nos dio. Sin ellas, una boda de ochenta personas
parece un escenario donde nadie compartirá cumpleaños, una baraja en la mano
parece un objeto trivial, y una contabilidad falsa parece una contabilidad cualquiera.
Con ellas, ganas la apuesta, te asomas al universo entero a través de un mazo de cartas,
y descubres que un 1 que aparece demasiado puede mandar a alguien a la cárcel.
Conviene aprender a usarlas.
Leave a Reply