第一位数字最棒!
不要用数字来欺骗,会露马脚的,
根据本福特定律所说。
第一位数字
在一组数里,你预料第一位数字为 "1" 的概率是多少?
例子:这是一些支出的数据:
- ¥65.20(第一位数字是 6)
- ¥35.00(第一位数字是 3)
- ¥7.50(第一位数字是 7)
- ¥12.50(第一位数字是 1)
第一位数字为 1 和第一位数字为 2 的出现次数是不是差不多的?
1 只不过是个数字,和 2 到 9 一样,对不?
所以 以 1 为第一位数字的可能性应该是九分之一(大约 11%):
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
11% | 11% | 11% | 11% | 11% | 11% | 11% | 11% | 11% |
但这是不对的!
物理学家弗兰克•本福特发现,很多时候,第一位数字为 1 的概率大约是 30%。
以 9 为第一位数字的概率只有 5%。
传说科学家及数学家西蒙·纽康博士留意到一本对数表的前面部分都用得非常残旧,但后面部分则用得比较少。
"为什么人比较喜欢用 1 和 2 来计算,而不喜欢用 8 和 9 呢?"
他自己去研究(科学家和数学家都喜欢研究奇特的的事!)
纽康博士发觉不同的数据,例如棒球数据、河流面积、人口、地址和其他很多数据都有这个特点。
为什么是这样的?
我们来看看地址:
门牌号码的第一位数字是什么?
- 短的道路:1、2、3、4、5、6
- 长一点都道路: 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16(注意很多门牌号码第一位数字都是 1 吗?)
- 再长的道路的门牌号码可以到 30(很多 "1" 和 "2")
- 很长的道路的门牌号码很多是大于 100 的。
结果是以 1 为第一位数字的门牌号码最常见,跟着是 2,最少见的是 9。
例子:股票价格
假设一个股票的价格从 1.00 开始,每次增加 10%:
价格 | 第一位数字 |
---|---|
1.00 | 1 |
1.10 | 1 |
1.21 | 1 |
1.33 | 1 |
1.46 | 1 |
1.61 | 1 |
1.77 | 1 |
1.95 | 1 |
2.14 | 2 |
2.36 | 2 |
2.59 | 2 |
2.85 | 2 |
3.14 | 3 |
3.45 | 3 |
3.80 | 3 |
4.18 | 4 |
4.59 | 4 |
5.05 | 5 |
5.56 | 5 |
6.12 | 6 |
6.73 | 6 |
7.40 | 7 |
8.14 | 8 |
8.95 | 8 |
9.85 | 9 |
很多 1,也有不少 2,3 少一点……
结果
本福特发现第一位数字为 d 的概率是:
P(d) = log10(1 + 1/d)
例子:第一位数字为 2 的概率:
P(2) | = log10(1 + 1/2) |
= log10(1.5) | |
= 0.17609…… | |
= 17.6% (舍入值) |
这是所有的概率:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
30.1% | 17.6% | 12.5% | 9.7% | 7.9% | 6.7% | 5.8% | 5.1% | 4.6% |
例子:大山统计了 100个年度支出报销。
有圆珠笔 ¥1.95、标记笔 ¥4.95 等等的数据。这是第一位数字的统计:
第一位数字: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
次数 | 26 | 19 | 10 | 11 | 9 | 15 | 2 | 5 | 4 |
相当符合本福特定律。
除了有很多 "6",因为打印纸的价钱是 ¥6,而且公司买了很多打印纸。
彩票
彩票号码不遵循这个定律,因为彩票号码不是物体的大小或量,彩票号码只不过是符号(不用号码而用字母或者图画也可以)。
找骗子
当人们制造虚假数据时,他们通常随机地选择第一位数字,结果是 "9" 和 "1" 的出现次数都差不多。
但电脑程序可以分析所有的数据来得到以 "1" 为第一位数字的概率,并且与以 "5" 或 "9" 为第一位数字的概率比较。如果结果和本福特定律相差太远……数据就可能有问题了!
这可以帮助发现税务欺瞒、选举造假和其他的不当行为。
轮到你了
随便选择一个类别,搜集 100个数字。数字必须是某些东西的量,例如数量、大小等等(而不是符号)。
例如:
- 门牌号码
- 城市人口
- 超市价钱
- 汽车价钱
把第一位数字写到这个列表里:
第一位数字: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
出现次数: |
你的结果是什么?
额外活动
找几个好朋友来做一些购物单,然后去找每个物品的价钱。把第一位数字写进列表里:
第一位数字: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
出现次数: |
留意到什么吗?