贝叶斯定理

贝叶斯很奇妙!

你可曾想过电脑是怎样学习人类行为的?

鞋带

例子:

在互联网上搜索 "电影 自动 鞋带" 的结果是 "回到未來"

搜索器看过这部电应了吗?不是,但基于从过去的搜索历史,它知道人们很有可能是在寻找这个。

搜索器用贝叶斯定理来求这个概率。

贝叶斯定理是在已经知道其他概率的情况下去求概率的方法。

公式是:

P(A|B) = P(A) P(B|A)
P(B)

它告诉我们在 B 发生的条件下,A 发生的概率(写为 P(A|B)),若我们已知道在 A 发生的条件下,B 发生的概率(写为 P(B|A)) 和 A 和 B 独自发生的概率。

若 P(火) 代表有火的可能性,P(烟) 代表有烟的可能性,则:

P(火|烟) 的意思是当有烟时,有火的可能性。
P(烟|火) 的意思是当有火时,有烟的可能性。

所以公式好像是告诉我们 "将会" 可能发生的,若我们已知道 "过去" 已经发生的(反之亦然)

例子:如果危险的火灾不常见(1%),但因为有工厂,烟比较常见(10%),而 90% 的危险火灾会产生烟,则:

P(火|烟) = P(火) P(烟|火)  = 1% x 90%  = 9%
P(烟) 10%

在这例子里,9% 有烟的时间也会有危险的火灾。

郊游

例子:郊游日

你今天打算去郊游,但早上多云

今天下雨的可能性有多大?

我们用"雨"来代表今天下雨,"云"来代表早上多云。

当早上多云时,当天会下雨的可能性是 P(雨|云)

代入公式里:

P(雨|云) = P(雨) P(云|雨)
P(云)
P(雨|云) = 0.1 x 0.5  = .125
0.4

今天下雨的概率是 12.5%。不错,可以去郊游了!

怎样去记

想 "AB AB AB",然后这样分组:"AB = A BA / B"

P(A|B) = P(A) P(B|A)
P(B)

"A" 有两个可能

贝叶斯定理的其中一个著名用途是 假阳性和假阴性

在这个情况,"A" 有两个可能,例如 及格/不及格 (或 是/否 等等)

例子:有没有敏感?

猫猫

大牛说他浑身发痒。有一个检测可以知道她是不是对猫有敏感,但这个检测不一定是对的:

如果有 1% 的人有这种敏感,而大牛的检测结果是 "有",大牛真的有这种敏感的可能性有多大?

我们想知道当检测结果是 "有" 的时候,有这种敏感的可能性,我们吧我这个概率写为 P(敏感|有)

公式是:

P(敏感|有) = P(敏感) P(有|敏感)
P(有)

糟了!我们不知道检测结果是 "有" 的一般 可能性是多少……

…… 但我们可以把这种敏感和没有这种敏感的概率相加来求这个一般概率:

把概率加起来:

P(有) = 1% × 80% + 99% × 10% = 10.7%

就是说大约 10.7% 的人会得到 "有" 的检测结果。

我们可以用公式了:

P(敏感|有) = 1% × 80%  = 7.48%
10.7%

P(敏感|有) = 大约 7%

这和我们在 假阳性和假阴性 网页里计算的答案是一样的。

我们甚至有一个专为这个情形而设的贝叶斯定理特别版本:

P(A|B) = P(A)P(B|A)
P(A)P(B|A) + P(非A)P(B|非A)

"A" 有三个(或以上)可能

在上面的例子里, "A" 有两个可能性(A 和 非A),都放到公式里的分数下面

如果 "A" 有 3个或以上可能,我们把它们全部都放到分数的下面:

P(A1|B) = P(A1)P(B|A1)
P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3) + …… 等等

画展

例子:有三个画家参加艺术比赛:毕大师、加大师和索大师

毕大师赢头奖的可能性是多少?

P(毕大师|头奖) = P(毕大师)P(头奖|毕大师)
P(毕大师)P(头奖|毕大师) + P(加大师)P(头奖|加大师) + P(索大师)P(头奖|索大师)

把值代入公式里:

P(毕大师|头奖) = (15/30) × 4%
(15/30) × 4% + (5/30) × 6% + (10/30) × 3%

全部乘以 30 (接下来的计算会简单很多):

P(毕大师|头奖) = 15 × 4%  = 0.6  = 50%
15 × 4% + 5 × 6% + 10 × 3% 0.6 + 0.3 + 0.3

机会不错!

毕大师不是最成功的画家,但她提交了很多幅画去参赛。

你现在应该知道搜索引擎怎样猜测你想找什么了:它们记录了很多人的搜索输入(关键词)和他们最后点击的网站。

然后用贝叶斯定理来计算搜索结果的显示次序。

好像它们洞悉你的心灵!