Según el censo del INEGI de 2020, en México hay 2469 municipios. El número de habitantes en estos municipios varía entre 81 y 1,922,523. Curiosamente, en 772 de estos municipios (aproximadamente el 31.3%) el número de habitantes comienza con el dígito 1. Para los demás dígitos (2, 3, ..., 9), las frecuencias como primer dígito son 17.6%, 12.6%, 10.3%, 7.4%, 6.8%, 5.1%, 4.1% y 4.8%, respectivamente.
Es sorprendente, porque en una lista de números "aleatorios" esperaríamos que cualquiera de los 9 dígitos posibles apareciera como primer dígito con la misma frecuencia (11.1% = 1/9). Esta misma distribución del 1er dígito se observa en muchas colecciones de números en la vida real: por ejemplo, las áreas de municipios, las longitudes de ríos, el consumo mensual de electricidad, el número de enfermos de COVID-19 en cada municipio, los saldos de cuentas bancarias, entre muchos otros ejemplos. Además, el fenómeno persiste aunque cambiemos la unidad de medición (millas en lugar de kilómetros para las longitud, dólares en lugar de pesos en saldos bancarios).
Esta curiosa distribución de frecuencias se conoce como la Ley de Newcomb-Benford, o la Ley del primer dígito. Fue observada por primera vez por el astrónomo Simon Newcomb en 1881 y redescubierta independientemente por Frank Benford en 1938. Aunque se han propuesto varias explicaciones teóricas, sigue siendo un área activa de investigación y numerosas publicaciones.
En esta charla presentaré más ejemplos (y contraejemplos) de esta ley y sus generalizaciones, algunas de las explicaciones propuestas, y cómo se ha convertido en una herramienta valiosa para la detección de fraudes en bases de datos.