Cuando los números son mágicos
Imagínate una boda. Una de esas con ochenta invitados, comida abundante, primos que se reencuentran tras una década, un tío que ha bebido más de lo recomendable y una tía que está convencida de que la pareja no va a durar. En algún momento entre el segundo plato y el café te levantas, golpeas suavemente la copa con un cuchillo (clinc-clinc, atención todos), y propones lo siguiente: apuesto cualquier cosa a que dos personas en esta sala cumplen años el mismo día.
La sala se ríe. Algunos hacen mentalmente la cuenta: ochenta personas, trescientos sesenta y cinco días, eso es como un veintidós por ciento, ¿qué dice este? El cuñado, que lo suele saber todo, te mira con esa pena condescendiente que reservan para quien va a aprender una lección dura. La novia, que es la única que ha bebido menos que tú, frunce el ceño. Tú insistes. Cualquier cosa. Una ronda de chupitos, la siguiente cena, el alma de tu primogénito.
Aceptan. Lo que ninguno sabe es que con ochenta personas en la sala, la probabilidad de que dos compartan cumpleaños es del 99,9914%. En términos prácticos, ya has ganado. Solo falta encontrarlos.
Esto es la paradoja del cumpleaños (Birthday Paradox), y es de las cosas más bonitas que tiene la probabilidad. No porque sea complicada, sino porque es exactamente al revés: es absurdamente sencilla. Veintitrés personas en una sala bastan para que la probabilidad de cumpleaños compartido cruce el 50%. Con cincuenta y siete pasamos del 99%. Con setenta, del 99,9%. Y solo necesitamos llegar a 366 para que sea matemáticamente seguro al cien por cien. En cualquier clase del colegio, en cualquier reunión de junta directiva con dos dígitos de asistentes, en cualquier cena de empresa medianamente concurrida, hay cumpleaños duplicado. Es casi seguro.
Lo que tu cerebro hace cuando oye esto por primera vez es algo muy concreto. Se imagina a sí mismo en la sala, mira a las otras 22 personas, y calcula: «¿qué probabilidades hay de que alguno de estos 22 cumpla años el mismo día que yo?». La respuesta a esa pregunta es, efectivamente, baja: alrededor del 6%. El problema es que esa no es la pregunta. La pregunta es «si cualquier par de personas en la sala comparte cumpleaños». No tú con alguien: cualquier dos. Y aquí es donde la cosa se pone molona. En una sala de 23 personas no hay 23 comparaciones posibles. Hay 253. Cada persona se compara con cada otra, y el número de parejas crece muy rápido: con la fórmula n(n−1)/2, 23 personas generan 253 parejas. Cada una de esas 253 parejas tiene una probabilidad muy pequeña de coincidir, pero 253 lanzamientos de una moneda muy sesgada acaban dando cara con bastante facilidad. Pensamos en personas y las matemáticas te dicen que pienses en parejas. Pensamos en lineal y el universo está pensando en cuadrático. (¡Magia!)
La paradoja del cumpleaños tiene una historia curiosamente humilde, casi nadie quiere ser su padre. La primera publicación formal data de 1939 y la firma Richard von Mises, un matemático austriaco con una vida que daría para una entrada propia: nació en Lemberg (la actual Lviv ucraniana), fue piloto en la Primera Guerra Mundial, dirigió el Instituto de Matemáticas Aplicadas de Berlín durante los años 20, huyó del régimen nazi en 1933 a pesar de haber servido en el ejército austrohúngaro, dio clases en Estambul, terminó en Harvard como catedrático de aerodinámica, y entre todo eso encontró tiempo para ser una autoridad mundial en la poesía de Rainer Maria Rilke. La leyenda dice que se le ocurrió el problema en una fiesta, mientras observaba a los invitados. Pero von Mises fue el primero en publicarlo, no el primero en pensarlo. Doce años antes, alrededor de 1927, el matemático británico Harold Davenport ya había planteado el problema en charlas y conversaciones en Cambridge, sin atreverse nunca a ponerlo por escrito porque estaba convencido de que aquello era demasiado bonito para ser nuevo. Sospechaba que alguien, en algún libro polvoriento del siglo XIX, ya lo habría enunciado. Murió sin saber que probablemente sí era suyo. En fin, hay tipos de modestia que cuestan caras.
La parte que casi nadie sospecha es que esta idea de fiesta se ha colado en tu vida digital. Cuando hoy haces una transferencia bancaria, firmas un contrato electrónico o descargas una actualización de WhatsApp, el sistema que valida que esos datos no han sido manipulados se llama función hash criptográfica. Su trabajo consiste en convertir cualquier archivo en una huella digital corta, única para ese archivo. Si alguien cambia un solo bit, la huella cambia entera. Pero dos archivos distintos no deberían producir nunca la misma huella, porque entonces un atacante podría sustituir un contrato firmado por otro fraudulento sin que nadie lo notara. A esa coincidencia se le llama colisión, y es exactamente lo mismo que dos personas compartiendo cumpleaños. El ataque que utilizan los hackers para encontrarla se llama, sin metáforas ni adornos, birthday attack. La razón es matemática pura: si una función hash genera 128 bits de salida (eso son 2¹²⁸ cumpleaños posibles), un atacante ingenuo pensaría que necesita probar 2¹²⁸ entradas distintas. Por la paradoja del cumpleaños, le basta con probar 2⁶⁴, la raíz cuadrada del total. Sigue siendo mucho, pero es la diferencia entre «imposible» y «podría intentarlo Google si tuviera ganas». De hecho, Google las tuvo: en 2017 demostró la primera colisión SHA-1 del mundo, lo que llevó a la industria a abandonar SHA-1 a marchas forzadas. Es gracioso pensar en que una idea de fiesta de los años 30 se había comido un protocolo de seguridad global.
* * *
Ahora bien, si veintitrés personas en una sala generan 253 pares y eso ya alcanza para jugar con tu cerebro, qué pasa cuando los elementos crecen un poco más. No mucho. Solo de 23 a 52. Saca una baraja de 52 cartas y barájala bien. La que tienes ahora delante, con ese orden exacto, no había existido nunca. Y no volverá a existir. No en esta sala, ni en este planeta, ni en esta galaxia. Tampoco en este universo. No es esoterismo: es una multiplicación.
Para saber de cuántas formas se puede ordenar una baraja se hace algo que parece aburrido, pero da un número maravilloso. Se multiplica 52 por 51, el resultado por 50, el resultado por 49, el resultado por 48 y así hasta llegar al 1. Eso es lo que los matemáticos llaman el factorial de 52, y lo escriben con un signo de exclamación: 52!. El número que sale tiene 68 cifras:
80.658.175.170.943.878.571.660.636.856.403.766.975.289.505.440.883.277.824.000.000.000.000
Aproximadamente 8 × 10⁶⁷. Decirlo en voz alta no sirve de nada. La cabeza humana se atasca cuando llega al billón y a partir de ahí es todo «muchísimo». Hay que entrar por otra puerta. La que viene a continuación la diseñó hace años un programador llamado Scott Czepiel y, con datos verificados, sigue siendo la mejor que conozco para dimensionar 52!. No es eficiente. Es muchas cosas, pero eficiente no.
Vamos a dimensionarlo.
Imagínate un cronómetro encima de la mesa programado para que cuente hacia atrás 52! segundos. Cada segundo corresponde a un orden diferente de tu baraja de cartas. Tu trabajo es matar todo ese tiempo. Te plantas en algún punto del ecuador, cualquiera, y empiezas a caminar. Pero no caminas como caminaríamos tú o yo. Caminas a un ritmo muy particular: das un paso cada mil millones de años. Sí, lo has leído perfectamente: 1000 millones de años. Un paso. Mil millones más, otro paso. Con un ecuador de 40.075 kilómetros y pasos de un metro, completar la primera vuelta al planeta te lleva unos cuarenta mil billones de años (billones europeos, no los americanos de nueve ceros: 4 × 10¹⁶). El universo entero, recordemos, tiene 13.800 millones de años. Acabas de tardar tres millones de edades del universo en dar un paseo alrededor de la Tierra. Y solo es el calentamiento.
Cuando termines la vuelta, te agachas sobre el océano Pacífico y le quitas una gota de agua. Una. Acto seguido te das la vuelta y empiezas otra vez. Otra circunnavegación al ritmo geológico, otra gota fuera del Pacífico cuando termines. El Pacífico tiene 707 millones de kilómetros cúbicos de agua, así que ahí dentro hay del orden de 1,4 × 10²⁵ gotas, y vas a sacarlas todas, una por vuelta. Si dentro de unos cuantos eones algún oceanógrafo del futuro detecta que el nivel del Pacífico está bajando un picómetro cada cuarenta mil billones de años, ese serás tú.
Pasan los milenios, los millones de años, las eras geológicas. Pasan, en realidad, escalas de tiempo para las que ni siquiera existe palabra. Pero un día, después de muchísimas vueltas, miras hacia abajo y ves el lecho del Pacífico al descubierto. Lo has secado. Vacío. Ese día tienes derecho a una recompensa, y la recompensa es esta: dejas en el suelo una hoja de papel. Una. De las finas. 0,1 milímetros. Después rellenas el océano (no me preguntes de qué, es tu problema) y vuelves a empezar. Otro Pacífico vaciado, otra hoja sobre la primera. Empiezas a formar una pila. La pila tiene un destino: el Sol. Cuando la torre de papel mida 149,6 millones de kilómetros y la primera hoja toque la fotosfera, podrás detenerte. Te van a hacer falta unos 1.500 billones de hojas. Cada hoja te ha costado vaciar el Pacífico una vez, y cada Pacífico te ha costado dar gota a gota la vuelta entera al planeta a un paso por eón.
Una hoja por Pacífico. Conviene no pensarlo demasiado.
El día que la última hoja se desintegre suavemente al rozar el Sol, miras el cronómetro. Te recuerdo que arrancaste en 8,066 × 10⁶⁷ segundos. Mírala bien. La cifra que te devuelve ahora es 8,063 × 10⁶⁷ segundos. Las tres primeras cifras siguen iguales. Llevas, en términos prácticos, sin empezar. La pila entera de papel hasta el Sol, levantada gota a gota desde el océano más grande del planeta a un paso por eón, te ha consumido apenas un 0,033% del tiempo total. Tres centésimas de un uno por ciento. Una diezmilésima.
Toca repetir. La operación completa (Pacífico, hoja, Sol, Pacífico, hoja, Sol), mil veces más. Mil torres de papel del tamaño de la unidad astronómica, levantadas a base de drenar el océano más grande de la Tierra a paso geológico. Y solo cuando la milésima torre se evapore en el plasma solar, el cronómetro habrá descontado un tercio del tiempo. Te quedan dos. Mil pilas de papel hasta el Sol y vas por el primer acto de tres.
Eso es 52!. La cantidad de órdenes posibles de un mazo de cartas que cabe en un bolsillo trasero. Si todos los humanos que han pisado la Tierra (los 117.000 millones que el Population Reference Bureau calcula desde el origen de la especie) hubieran estado barajando una baraja por segundo, sin parar, desde el Big Bang hace 13.800 millones de años, hoy llevarían apenas 5 × 10²⁸ combinaciones generadas. A 52! le seguiría faltando un factor de 10³⁹ para alcanzarse. Treinta y nueve órdenes de magnitud por encima de un esfuerzo cósmico colectivo. La humanidad entera barajando desde antes de que existieran las estrellas y aún no hemos arrancado. Y por si esto no fuera poco para explotarte la cabeza, te doy otro detalle: si existen 8 × 10⁶⁷ posibilidades, ¿cuántas veces tendrás que mezclar la baraja para llegar a una posición verdaderamente aleatoria? Intuitivamente, muchas. Quizá miles. Quizá millones. La respuesta es siete.
La dio en 1992 un matemático llamado Persi Diaconis, junto con su colega Dave Bayer, en un artículo con uno de los títulos más bonitos de la literatura académica: Trailing the Dovetail Shuffle to Its Lair. Persiguiendo al barajeo de cascada hasta su madriguera. La frase no era suya. La había acuñado a principios del siglo XX un cartomago llamado Charles Jordan que hoy nadie recuerda. Que un catedrático de Stanford homenajeara a un mago olvidado en el título de su paper más citado tiene sentido, porque resulta que Diaconis fue cartomago profesional antes que matemático. Y, técnicamente, todavía lo es. A los 14 años, en vez de estudiar, pasaba las tardes en Tannen’s Magic Store, en pleno Times Square, donde los magos de Nueva York se reunían a enseñarse trucos. Una de aquellas tardes se le acercó Dai Vernon, un canadiense bajito y encantador al que el gremio llamaba «el hombre que engañó a Houdini» y al que sus colegas consideraban, sin ironía, el Einstein de la cartomagia. Vernon le pidió que le enseñara lo que sabía hacer con las cartas. Persi, con catorce años, se las enseñó. Dos días después le sonó el teléfono. Era Vernon. «Quedamos pasado mañana a las dos en la West Side Highway. Vente de gira.»
Persi hizo la maleta y se fue sin avisar a sus padres. Pasó la siguiente década recorriendo barcos transatlánticos entre Nueva York y Sudamérica, haciendo cartomagia por las noches y desplumando a los pasajeros en partidas de póker en las que nadie sospechaba del adolescente. A los 24 decidió que las matemáticas que había detrás de las cartas le interesaban más que las cartas, y se apuntó a clases nocturnas en el City College de Nueva York pagándose la matrícula con sus shows. Llegó a Harvard porque Martin Gardner, el legendario columnista de Scientific American y mago aficionado, le escribió a la facultad una carta que decía, más o menos, que ese chaval había inventado dos de los diez mejores trucos de cartas de la última década, y que le dieran una oportunidad. En Harvard, eso era criterio suficiente. Doctorado en estadística en 1974, cátedra en Stanford, beca MacArthur en 1982. Lleva décadas estudiando lo que pasa cuando barajas, lo que pasa cuando lanzas una moneda al aire (resultado: si la lanzas con cara arriba, cae cara el 51% de las veces), y lo que pasa cuando un falso psíquico se cree que va a engañarle. En 1992, lo que él y Bayer demostraron es que con seis pasadas de cascada (el barajeo normal de toda la vida) la baraja todavía recuerda demasiado su orden inicial. Con siete, ya no. Pasas, en treinta segundos, de un mazo recién comprado a un mazo indistinguible de cualquiera de los 8 × 10⁶⁷ órdenes posibles. La aleatoriedad llega rápido, cuando el caos es profundo.
* * *
Hasta aquí hemos visto que nuestro cerebro no está acostumbrado a entender según qué magnitudes. Veintitrés personas se sienten poco aunque generen 253 pares. Cincuenta y dos cartas se sienten manejables aunque generen una galaxia de combinaciones. Pero hay algo todavía más raro, una capa más profunda de equivocación, y tiene que ver no con cuántos números hay sino con cómo son los propios números cuando los miras de cerca.
Coge una factura cualquiera. Una nómina. La cifra de habitantes de tu pueblo. La distancia que has hecho en coche este año. Las cotizaciones de cierre del IBEX en el último mes. El precio de los apartamentos en el portal inmobiliario. Cualquier conjunto de números que vengan del mundo real. Apunta el primer dígito de cada uno (no el más significativo en términos de magnitud, sino el primero que aparece escrito) y haz un recuento. El reparto justo sería sencillo: nueve dígitos del 1 al 9, cada uno apareciendo una de cada nueve veces. Un 11,1%. Demócrata.
Pues no. En cualquier conjunto suficientemente grande de números del mundo real, el dígito 1 aparece como primera cifra el 30,1% de las veces. El 2, un 17,6%. El 3, un 12,5%. El 9, apenas un 4,6%. El uno aparece casi siete veces más que el nueve. No es una pequeña desviación: es una proporción descomunal, sistemática, y aparece donde no tiene ningún derecho a aparecer.
A este patrón se le llama ley de Benford y la descubrió en 1881 un astrónomo canadiense-americano llamado Simon Newcomb, en una de las observaciones más casuales de la historia de la ciencia. Antes de que existieran las calculadoras electrónicas, los científicos hacían cálculos consultando libros de tablas de logaritmos, tomos enormes con cientos de páginas de cifras. Newcomb se fijó un día en un detalle aparentemente trivial: en su biblioteca, las primeras páginas de los libros de logaritmos (las que correspondían a números que empezaban por 1) estaban significativamente más sucias y desgastadas que las últimas (las del 8 y el 9). La gente las consultaba mucho más. Newcomb dedujo que los números empezados por dígitos pequeños debían aparecer más en la naturaleza, calculó la distribución, publicó un artículo de dos páginas en el American Journal of Mathematics y se fue a hacer otras cosas. Nadie le hizo caso.
Cincuenta y siete años después, en 1938, un físico de General Electric llamado Frank Benford observó exactamente lo mismo, también con tablas de logaritmos manchadas, y decidió hacer algo más serio: recopiló más de 20.000 cifras tomadas de veinte fuentes completamente distintas. Las superficies de 335 ríos. Los habitantes de 3.259 ciudades de Estados Unidos. 104 constantes físicas. 1.800 pesos moleculares. 308 números aparecidos en un ejemplar de Reader’s Digest. Las direcciones postales de las primeras 342 personas que aparecían en American Men of Science. 418 tasas de mortalidad. Y en todas esas listas, sin excepciones llamativas, salió la misma curva: el 1 mandando con un 30%, decreciendo hasta el 9. Su artículo se llamó The Law of Anomalous Numbers. La ley se conoce desde entonces por su apellido, no por el de Newcomb, en un ejemplo perfecto de la ley de Stigler, según la cual ningún descubrimiento científico lleva el nombre de su descubridor. (La ley de Stigler, dicho sea de paso, no la descubrió Stigler.)
¿Por qué pasa esto? La explicación corta es que la mayoría de los datos del mundo real no se distribuyen linealmente, sino logarítmicamente. Crecen multiplicándose. Una población que crece al 4% anual tarda mucho más en pasar de 1.000 a 2.000 (necesita duplicarse) que de 8.000 a 9.000 (un mero 12,5% más). Por tanto, vivirá mucho más tiempo con un 1 delante que con un 9. Y como esto se reinicia en cada orden de magnitud (de 10.000 a 20.000 vuelve a costar duplicarse), el 1 acumula tiempo, y aparece más. Hay también una propiedad bonita detrás, llamada invariancia de escala: si una distribución de números cumple la ley de Benford, sigue cumpliéndola cuando cambias las unidades. Mide los ríos en kilómetros, en millas, en codos egipcios o en la longitud del pie izquierdo de Carlomagno. La distribución del primer dígito no se mueve. Y resulta que solo hay una distribución posible que tenga esa propiedad, y es exactamente la que Newcomb y Benford observaron.
¿Y esto para qué me sirve?
Pues, lo que tendría que ser un pasatiempo matemático se ha convertido en una herramienta forense seria. Cuando alguien se inventa números (un asesor financiero falsificando informes, una empresa hinchando facturas, un gobierno maquillando estadísticas oficiales, un país inventando resultados electorales) tiende a distribuir los primeros dígitos de manera aproximadamente uniforme, porque su intuición humana le dice que así es como se ven los números aleatorios. Pero los números reales no son uniformes. Son Benford. Cualquier conjunto de cifras presuntamente naturales cuya primera cifra se reparta más o menos por igual entre los nueve dígitos es, en el mejor de los casos, sospechoso. En 1972 el economista Hal Varian propuso usar este principio para detectar fraude en datos socioeconómicos. En los años 90, el contable Mark Nigrini lo introdujo en la auditoría forense, y desde entonces se aplica de forma rutinaria por Hacienda, por las Big Four y por cualquier despacho que examine balances con sospecha. El asesor financiero Wesley Rhodes acabó condenado por fraude en parte porque sus documentos no cumplían Benford. La informática Jennifer Golbeck lo usó para destapar redes de bots rusos en Twitter. Diversos estudios académicos lo han aplicado a las elecciones iraníes de 2009 y a las cuentas que Grecia presentó a la Unión Europea antes de la crisis, con resultados llamativos en ambos casos. Los números, cuando se los miras desde lejos, no son un montón inerte de cifras. Tienen huellas dactilares.
* * *
Hay un patrón común en estas tres curiosidades, y vale la pena pararse a verlo. Tu cerebro evolucionó durante millones de años para resolver problemas muy concretos: contar miembros del clan, recordar dónde había agua, calcular si la cabra que se acerca por la izquierda llega antes que la pareja que se acerca por la derecha. Vivimos en grupos pequeños, en muestras pequeñas, en escalas humanas. Nadie en el Pleistoceno necesitaba intuir cuántos pares se forman con 23 personas, ni cómo se distribuyen los primeros dígitos de las longitudes de los ríos, ni cómo escala el factorial de un número modesto. Eran problemas que no existían. Y por eso la maquinaria que tenemos para pensarlos sigue siendo, esencialmente, la misma de aquel cazador frente a su fuego: lineal, intuitiva, mal preparada para la combinatoria, ciega ante los logaritmos.
Las matemáticas, vistas desde aquí, no son una asignatura abstracta. Son las gafas correctoras que la evolución no nos dio. Sin ellas, una boda de ochenta personas parece un escenario donde nadie compartirá cumpleaños, una baraja en la mano parece un objeto trivial, y una contabilidad falsa parece una contabilidad cualquiera. Con ellas, ganas la apuesta, te asomas al universo entero a través de un mazo de cartas, y descubres que un 1 que aparece demasiado puede mandar a alguien a la cárcel. Conviene aprender a usarlas.