条件概率
定义
设 A 与 B 为样本空间 Ω 中的两个事件,其中 P ( B )>0。那么在事件 B 发生的条件下,事件 A 发生的条件概率为:
条件概率有时候也称为:后验概率。
统计独立性
当且仅当两个随机事件 A 与 B 满足
的时候,它们才是统计独立的,这样联合概率可以表示为各自概率的简单乘积。
同样,对于两个独立事件 A 与 B 有
以及
换句话说,如果 A 与 B 是相互独立的,那么 A 在 B 这个前提下的条件概率就是 A 自身的概率;同样, B 在 A 的前提下的条件概率就是 B 自身的概率。
互斥性
当且仅当 A 与 B 满足
且
的时候, A 与 B 是互斥的。
因此,
换句话说,如果 B 已经发生,由于 A 不能和 B 在同一场合下发生,那么 A 发生的概率为零;同样,如果 A 已经发生,那么 B 发生的概率为零。
其它
如果事件 B {\displaystyle B} 的概率 P ( B ) > 0 {\displaystyle P(B)>0} ,那么 Q ( A ) = P ( A | B ) {\displaystyle Q(A)=P(A|B)} 在所有事件 A {\displaystyle A} 上所定义的函数 Q {\displaystyle Q} 就是概率测度。
如果 P ( B ) = 0 {\displaystyle P(B)=0} , P ( A | B ) {\displaystyle P(A|B)} 没有定义。
条件概率可以用决策树进行计算。
形式定义
考虑概率空间Ω(S, σ(S)),其中σ(S)是集S上的σ代数,Ω上对应于随机变量X的概率测度(可以理解为概率分布)为P X ;又A∈σ(S),P X (A)≥0(这里可以理解为事件A,A不是零测集)。则∀E∈σ(S),可以定义集函数P X|A 如下:
P X|A (E)=P X (A∩E)/P X (E)。
易知P X|A 也是Ω上的概率测度,此测度称为 X在A下的条件测度 (条件概率分布)。
独立性 :设A,B∈σ(S),称A,B在概率测度P下为相互 独立的 ,若P(A∩E)=P(A)P(E)。
条件概率谬论
条件概率的谬论是假设 P ( A | B )大致等于 P ( B | A )。数学家John Allen Paulos在他的《数学盲》一书中指出医生、律师以及其他受过很好教育的非统计学家经常会犯这样的错误。这种错误可以通过用实数而不是概率来描述数据的方法来避免。
P ( A | B )与 P ( B | A )的关系如下所示:
下面是一个虚构但写实的例子, P ( A | B )与 P ( B | A )的差距可能令人惊讶,同时也相当明显。
若想分辨某些个体是否有重大疾病,以便早期治疗,我们可能会对一大群人进行检验。虽然其益处明显可见,但同时,检验行为有一个地方引起争议,就是有检出假阳性的结果的可能:若有个未得疾病的人,却在初检时被误检为得病,他可能会感到苦恼烦闷,一直持续到更详细的检测显示他并未得病为止。而且就算在告知他其实是健康的人后,也可能因此对他的人生有负面影响。
这个问题的重要性,最适合用条件概率的观点来解释。
假设人群中有1%的人罹患此疾病,而其他人是健康的。我们随机选出任一个体,并将患病以disease、健康以well表示:
假设检验动作实施在未患病的人身上时,有1%的概率其结果为假阳性(阳性以positive表示)。意即:
最后,假设检验动作实施在患病的人身上时,有1%的概率其结果为假阴性(阴性以negative表示)。意即:
现在,由计算可知:
是整群人中健康、且测定为阴性者的比率。
是整群人中得病、且测定为阳性者的比率。
是整群人中被测定为假阳性者的比率。
是整群人中被测定为假阴性者的比率。
进一步得出:
是整群人中被测出为阳性者的比率。
是某人被测出为阳性时,实际上真的得了病的概率。
这个例子里面,我们很轻易可以看出P(positive|disease)=99%与P(disease|positive)=50%的差距:前者是你得了病,而被检出为阳性的条件概率;后者是你被检出为阳性,而你实际上真得了病的条件概率。由我们在本例中所选的数字,最终结果可能令人难以接受:被测定为阳性者,其中的半数实际上是假阳性。
参见
贝叶斯定理
最大似然函数
后验概率
概率论
Monty Hall problem
Prosecutor"s fallacy
条件期望
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值