现实世界的数字以1开头的概率比你想的更高

你可能认为数字 1 到 9 应该轮流出现在现实世界数字的前面。事实并非如此。在许多自然数据集中，数字 1 大约有 30% 的概率出现在首位，而 9 的出现率不足 5%。^[1]

这种奇怪的不平衡被称为本福特定律，一旦你注意到它，世界似乎就显得有些被操纵。电费账单、河流长度、股票价格、发票总额以及人口统计等常常倾向于较小的首位数字。^[1][2] 如果数字均匀分布，每个数字出现首位的概率约为 11.1%。然而现实生活中，令人恼火的是，它表现出完全不同的情况。^[1]

故事始于一个极具古典味道的线索：脏旧的书页。1881 年，天文学家西蒙·纽康姆注意到对数表的前几页比后面的页码更磨损，这表明人们查找以 1 开头的数字的频率远高于以 8 或 9 开头的数字。^[2]随后，1938 年，物理学家弗兰克·本福德在 20 个不同类别（包括河流、人口、物理常数和死亡率）中对超过 20,000 个数字进行检验，发现了同样的模式。^[1][2]

这为什么会发生？因为许多现实世界的量在尺度上是乘法式扩展的，而不是整齐的。在对数尺度上，1 到 2 的区间要远宽于 9 到 10 的区间，因此数值更可能落在“以 1 开头”的区间，而不是“以 9 开头”的区间。^[1][2] 这听起来不合理，直到你想象某事随时间增长。公司的销售额可能在从 100 万美元增长到 200 万美元的过程中花费很长时间，而从 900 万美元增长到 1000 万美元的时间则要短得多。^[3]

这就是事实不再只是有趣而开始变得有用的地方。会计师和审计师使用本福特分析来扫描大量财务数据以寻找异常，因为伪造的数字常常暴露出人类大脑对假随机性的糟糕直觉。^[3][4] 试图制造“自然外观”数字的人往往会把数字分布得过于均匀，或集中在 4,999 美元、99,000 美元等阈值附近，这会让可疑的模式显现出来。^[4]

但本福特定律并不是测谎仪，这正是大多数人忽视的转折点。它在跨越多个数量级且未被人为分配、设上限或受限的数据集上效果最佳。邮政编码、发票号码以及政策固定的价格都不是合适的候选，甚至诚实的数据也可能因极其平常的原因显得异常。^[2][3][4] Case IQ 采访的一位审计师发现某学区的数字中以 2 开头的比例过高，后来才得知每位教师都有 250 美元的课堂补贴。^[4]

这就是它重要的原因。本福特定律实际上提醒我们，现实有着直觉所忽略的纹理。你周围的数字不仅仅是计数，它们是指纹。有时发现人类谎言的最快方法是注意到自然通常以1开头。^[1][2][3]

现实世界的数字以1开头的概率比你想的更高

来源