贝叶斯定理
贝叶斯很奇妙!
你可曾想过电脑是怎样学习人类行为的?
例子:
在互联网上搜索 "电影 自动 鞋带" 的结果是 "回到未來"
搜索器看过这部电应了吗?不是,但基于从过去的搜索历史,它知道人们很有可能是在寻找这个。
搜索器用贝叶斯定理来求这个概率。
贝叶斯定理是在已经知道其他概率的情况下去求概率的方法。
公式是:
P(A|B) = | P(A) P(B|A) |
P(B) |
它告诉我们在 B 发生的条件下,A 发生的概率(写为 P(A|B)),若我们已知道在 A 发生的条件下,B 发生的概率(写为 P(B|A)) 和 A 和 B 独自发生的概率。
- P(A|B) 是在 B 发生的情况下 A 发生的概率
- P(A) 是 A 发生的概率
- P(B|A) 是在 A 发生的情况下 B 发生的概率
- P(B) 是 B 发生的概率
若 P(火) 代表有火的可能性,P(烟) 代表有烟的可能性,则:
P(火|烟) 的意思是当有烟时,有火的可能性。
P(烟|火) 的意思是当有火时,有烟的可能性。
所以公式好像是告诉我们 可能"将要" 发生的,若我们已知道 "过去" 已经发生的(反之亦然)
例子:如果危险的火灾不常见(1%),但因为有工厂,烟比较常见(10%),而 90% 的危险火灾会产生烟,则:
P(火|烟) = | P(火) P(烟|火) | = | 1% x 90% | = 9% |
P(烟) | 10% |
在这例子里,9% 有烟的情况也会有危险的火灾。
例子:郊游日
你今天打算去郊游,但早上多云
- 糟了!50% 的雨天的早上都是多云的!
- 但多云的早上其实并不罕见(大约 40% 的日子早上都是多云的)
- 同时这个月是干旱的(平均 30天里只有 3天会下雨,10%)
今天下雨的可能性有多大?
我们用"雨"来代表今天下雨,"云"来代表早上多云。
当早上多云时,当天会下雨的可能性是 P(雨|云)
代入公式里:
P(雨|云) = | P(雨) P(云|雨) |
P(云) |
- P(雨) 是今天下雨的概率 = 10%
- P(云|雨) 是在下雨天早上有云的概率 = 50%
- P(云) 早上多云的概率 = 40%
P(雨|云) = | 0.1 x 0.5 | = .125 |
0.4 |
今天下雨的概率是 12.5%。不错,可以去郊游了!
怎样去记
想 "AB AB AB",然后这样分组:"AB = A BA / B"
P(A|B) = | P(A) P(B|A) |
P(B) |
"A" 有两个可能
贝叶斯定理的其中一个著名用途是 假阳性和假阴性。
在这个情况,"A" 有两个可能,例如 及格/不及格 (或 是/否 等等)
过敏例子:是否过敏?
大牛说他浑身发痒。有一个检测可以知道她是不是对猫过敏,但这个检测不一定是对的:
- 对于真的有这种过敏的人,检测有 80% 的机会给回 "有" 的结果
- 对于没有这种过敏的人,检测有 10% 的机会给回 "有" 的结果("假阳性")
如果有 1% 的人有这种过敏,而大牛的检测结果是 "有",大牛真的有这种过敏的可能性有多大?
我们想知道当检测结果是 "有" 的时候,有这种过敏的可能性,我们吧我这个概率写为 P(过敏|有)
公式是:
P(过敏|有) = | P(过敏) P(有|过敏) |
P(有) |
- P(过敏) 是有这种过敏的概率 = 1%
- P(有|过敏) 是对于真的有这种过敏的人,检测的结果是 "有" = 80%
- P(有) 是对于任何人,检测的结果是 "有" = ??%
糟了!我们不知道检测结果是 "有" 的一般 可能性是多少……
…… 但我们可以把有这种过敏和没有这种过敏的概率相加来求这个一般概率:
- 1% 的人有这种过敏,检测对 80% 的这些人说 "有"
- 99% 的人没有这种过敏,检测对 10% 的这些人说 "有"
把概率加起来:
P(有) = 1% × 80% + 99% × 10% = 10.7%
就是说大约 10.7% 的人会得到 "有" 的检测结果。
我们可以用公式了:
P(过敏|有) = | 1% × 80% | = 7.48% |
10.7% |
P(过敏|有) = 大约 7%
这和我们在 假阳性和假阴性 网页里计算的答案是一样的。
我们甚至有一个专为这个情形而设的贝叶斯定理特别版本:
P(A|B) = | P(A)P(B|A) |
P(A)P(B|A) + P(非A)P(B|非A) |
"A" 有三个(或以上)可能
在上面的例子里, "A" 有两个可能性(A 和 非A),都放到公式里的分数下面
如果 "A" 有 3个或以上可能,我们把它们全部都放到分数的下面:
P(A1|B) = | P(A1)P(B|A1) |
P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3) + …… 等等 |
例子:有三个画家参加艺术比赛:毕大师、加大师和索大师
- 毕大师提交了 15幅画,她 4% 的作品曾赢过头奖。
- 加大师提交了 5幅画,她 6% 的作品曾赢过头奖。
- 索大师提交了 10幅画,他 3% 的作品曾赢过头奖。
毕大师赢头奖的可能性是多少?
P(毕大师|头奖) = | P(毕大师)P(头奖|毕大师) |
P(毕大师)P(头奖|毕大师) + P(加大师)P(头奖|加大师) + P(索大师)P(头奖|索大师) |
把值代入公式里:
P(毕大师|头奖) = | (15/30) × 4% |
(15/30) × 4% + (5/30) × 6% + (10/30) × 3% |
全部乘以 30 (接下来的计算会简单很多):
P(毕大师|头奖) = | 15 × 4% | = | 0.6 | = 50% |
15 × 4% + 5 × 6% + 10 × 3% | 0.6 + 0.3 + 0.3 |
机会不错!
毕大师不是最成功的画家,但她提交了很多幅画去参赛。
你现在应该知道搜索引擎怎样猜测你想找什么了:它们记录了很多人的搜索输入(关键词)和他们最后点击的网站。
然后用贝叶斯定理来计算搜索结果的显示次序。
好像它们洞悉你的心灵!