两千多年前的战国时期,魏王的大臣庞葱对魏王说:“如果有人说外面的街市有老虎,您相信吗?”魏王说不信。“如果又有一个人说呢?”魏王说:“我将半信半疑。”“如果有第三个人说呢?”魏王说:“我会相信。”
上面的故事被总结成一个成语,叫“三人成虎”。当一件事情,即使是谣言,被多人说之后,听的人就会相信。这种因为证据的出现而导致人对某个事情的可能性判断的变化,其实就是统计学的贝叶斯公式的应用。
我们假设一开始魏王对“街上有老虎”这个事情的可能性是0.01 。现在有个新的证据\(E\),即有人说街上有老虎。那么听到这个证据后,魏王对“街上有老虎”这个事情的可能性的最新判断是多少呢?
要计算这个数值,就需要用到贝叶斯公式:
$$P(H|E)=\frac{P(E|H)P(H)}{P(E)}$$
其中H就是某个假设,比如“街上有老虎”,E就是证据,比如“有人说街上有老虎”。P(H)就是“街上有老虎”的概率,就是魏王一开始认为“街上有老虎”的概率。P(E|H)是指,如果街上有老虎是事实,那么有人说街上有老虎的概率是多少?P(H|E)是指,如果有人说街上有老虎,那么街上真有老虎的概率是多少?P(E)是指出现“有人说街上有老虎”的概率,可以这样计算:
$$P(E)=P(E|H)P(H)+P(E|¬H)P(¬H)$$
其中¬H指的是“街上没有老虎”。
现在假设一开始魏王认为 “街上有老虎” 的概率为0.01,即\(P(H)=0.01\)。假设如果街上有老虎是事实,那么有人说街上有老虎的概率是0.9,如果街上没有老虎,那么有人说街上有老虎的概率是0.1。根据这些值,我们可以算出来,听到有人说街上有老虎后,魏王认为街上有老虎的概率是:
$$P(H|E)=\frac{P(E|H)P(H)}{P(E)}=\frac{0.9\times0.01}{ 0.9\times0.01 + 0.1\times0.99 }=\frac{1}{12}=0.08333…$$
现在魏王对“街上有老虎”的判断已经上升到了0.08了,不过还很低,因此他说“不信”。根据上面的公式,如果有第二个人也说“街上有老虎”,那么魏王的最新判断是什么呢?
$$P(H|E)=\frac{P(E|H)P(H)}{P(E)}=\frac{0.9\times\frac{1}{12}}{ 0.9\times \frac{1}{12} + 0.1\times \frac{11}{12}}=0.45$$
现在魏王对“街上有老虎”的判断已经上升到了0.45了,因此他说“半信半疑”。如果有第三个人也说“街上有老虎”,那么魏王的最新判断是什么呢?
$$P(H|E)=\frac{P(E|H)P(H)}{P(E)}=\frac{0.9\times0.45}{ 0.9\times 0.45 + 0.1\times 0.55}=0.88…$$
现在魏王对“街上有老虎”的判断已经上升到了近九成,怪不得他说“我会相信”。
上面的贝叶斯公式可以这样记:
$$P(H|E)P(E)=P(E|H)P(H)$$
这个公式是对称的,因此更容易记住。另外,这个P(E)的计算其实就是分两种情况,一种是H成立时,一种是H不成立时,这两种情况下E的概率相加即可。3blue1brown的视频非常有帮助:
最后,为了验证你对贝叶斯公式掌握情况,来做做下面这个题吧? 可以把答案留在评论区。
100个人中有10个罪犯. 已知10个罪犯中,有5个是穿红衣服,有8个穿白袜子。这一百个人中,有10个人穿红衣服,有45个穿白袜子,请问一个概率,遇到一个红衣服白袜子的人,多大的可能这人是个罪犯?