你可能认为数字 1 到 9 应该轮流出现在现实世界数字的前面。事实并非如此。在许多自然数据集中,数字 1 大约有 30% 的概率出现在首位,而 9 的出现率不足 5%。[1]
这种奇怪的不平衡被称为本福特定律,一旦你注意到它,世界似乎就显得有些被操纵。电费账单、河流长度、股票价格、发票总额以及人口统计等常常倾向于较小的首位数字。[1][2] 如果数字均匀分布,每个数字出现首位的概率约为 11.1%。然而现实生活中,令人恼火的是,它表现出完全不同的情况。[1]
故事始于一个极具古典味道的线索:脏旧的书页。1881 年,天文学家西蒙·纽康姆注意到对数表的前几页比后面的页码更磨损,这表明人们查找以 1 开头的数字的频率远高于以 8 或 9 开头的数字。[2]随后,1938 年,物理学家弗兰克·本福德在 20 个不同类别(包括河流、人口、物理常数和死亡率)中对超过 20,000 个数字进行检验,发现了同样的模式。[1][2]
这为什么会发生?因为许多现实世界的量在尺度上是乘法式扩展的,而不是整齐的。在对数尺度上,1 到 2 的区间要远宽于 9 到 10 的区间,因此数值更可能落在“以 1 开头”的区间,而不是“以 9 开头”的区间。[1][2] 这听起来不合理,直到你想象某事随时间增长。公司的销售额可能在从 100 万美元增长到 200 万美元的过程中花费很长时间,而从 900 万美元增长到 1000 万美元的时间则要短得多。[3]
这就是事实不再只是有趣而开始变得有用的地方。会计师和审计师使用本福特分析来扫描大量财务数据以寻找异常,因为伪造的数字常常暴露出人类大脑对假随机性的糟糕直觉。[3][4] 试图制造“自然外观”数字的人往往会把数字分布得过于均匀,或集中在 4,999 美元、99,000 美元等阈值附近,这会让可疑的模式显现出来。[4]
但本福特定律并不是测谎仪,这正是大多数人忽视的转折点。它在跨越多个数量级且未被人为分配、设上限或受限的数据集上效果最佳。邮政编码、发票号码以及政策固定的价格都不是合适的候选,甚至诚实的数据也可能因极其平常的原因显得异常。[2][3][4] Case IQ 采访的一位审计师发现某学区的数字中以 2 开头的比例过高,后来才得知每位教师都有 250 美元的课堂补贴。[4]
这就是它重要的原因。本福特定律实际上提醒我们,现实有着直觉所忽略的纹理。你周围的数字不仅仅是计数,它们是指纹。有时发现人类谎言的最快方法是注意到自然通常以1开头。[1][2][3]






