第一位数字最棒!

不要用数字来欺骗,会露马脚的,
根据本福特定律所说。

第一位数字

在一组数里,你预料第一位数字为 "1" 的概率是多少?

例子:这是一些支出的数据:

第一位数字为 1 和第一位数字为 2 的出现次数是不是差不多的?

1 只不过是个数字,和 29 一样,对不?

所以 以 1 为第一位数字的可能性应该九分之一(大约 11%)

1 2 3 4 5 6 7 8 9
11% 11% 11% 11% 11% 11% 11% 11% 11%

但这是不对的!

物理学家弗兰克•本福特发现,很多时候,第一位数字为 1 的概率大约是 30%

9 为第一位数字的概率只有 5%

传说科学家及数学家西蒙·纽康博士留意到一本对数表的前面部分都用得非常残旧,但后面部分则用得比较少。

"为什么人比较喜欢用 1 和 2 来计算,而不喜欢用 8 和 9 呢?"

他自己去研究(科学家和数学家都喜欢研究奇特的的事!)

纽康博士发觉不同点数据,例如棒球数据、河流面积、人口、地址和其他很多数据都有这个特点。

为什么是这样的?

我们来看看地址:

门牌号码的第一位数字是什么?

结果是以 1 为第一位数字的门牌号码最常见,跟着是 2,最少见的是 9。

例子:股票价格

假设一个股票的价格从 1.00 开始,每次增加 10%:

价格 第一位数字
1.00 1
1.10 1
1.21 1
1.33 1
1.46 1
1.61 1
1.77 1
1.95 1
2.14 2
2.36 2
2.59 2
2.85 2
3.14 3
3.45 3
3.80 3
4.18 4
4.59 4
5.05 5
5.56 5
6.12 6
6.73 6
7.40 7
8.14 8
8.95 8
9.85 9

很多 1,也不少 23 少一点……

结果

本福特发现第一位数字为 d 的概率是:

P(d) = log10(1 + 1/d)

例子:第一位数字为 2 的概率:

P(2) = log10(1 + 1/2)
  = log10(1.5)
  = 0.17609……
  = 17.6% (舍入值)

这是所有的概率:

1 2 3 4 5 6 7 8 9
30.1% 17.6% 12.5% 9.7% 7.9% 6.7% 5.8% 5.1% 4.6%

例子:大山统计了 100个年度支出报销。

有圆柱笔 ¥1.95、标记笔 ¥4.95 等等的数据。这是第一位数字的统计:

第一位数字: 1 2 3 4 5 6 7 8 9
次数 26 19 10 11 9 15 2 5 4

相当符合本福特定律。

除了有很多 of "6",因为打印纸的价钱是 ¥6,而公司买了很多打印纸。

彩票

彩票号码遵循这个定律,因为彩票号码不是物体的大小或量,彩票号码只不过是符号(不用号码而用字母或者图画也可以)。

找骗子

当人们制造虚假数据时,他们通常随机地选择第一位数字,结果是 "9" 和 "1" 的出现次数都差不多。

但电脑程序可以分析所有的数据来得到以 "1" 为第一位数字的概率,并且与以 "5" 或 "9" 为第一位数字的概率比较。如果结果和本福特定律相差太远……数据就可能有问题了!

这可以帮助发现税务欺瞞、选举造假和其他的不当行为。

 

轮到你了

随便选择一个类别,搜集 100个数字。数字必须是某些东西的测量,例如数量、大小等等(而不是符号)。

例如:

把第一位数字写到这个列表里:

第一位数字: 1 2 3 4 5 6 7 8 9
出现次数:                  

你的结果是什么?

 

额外活动

找几个好朋友来做一些购物单,然后去找每个物品的价钱。把第一位数字写进列表里:

第一位数字: 1 2 3 4 5 6 7 8 9
出现次数:                  

留意到什么吗?