S05E01 看待世界的概率视角

今天我们开始进入到第5季:概率统计这一部分内容。

1.从概率到条件概率

概率,相信大家都不会陌生,在各阶段的数学课上,他都是高频出现的常客,最简单的概率比如掷骰子,我问你:第一次掷出的点数为 $5$ 的概率为多大?你会毫不犹豫的说出答案: $\frac{1}{6}$。

这太简单了,如果我们只停留在这里,就没有什么意义了。接下来我增加一个限定条件:已知我抛出的骰子是奇数的情况下,我抛掷的点数为 $5$ 的可能性有多大?

发现了没有,第二个问题中,我们就没有直接的只问投掷出 $5$ 这个事件的概率,而是增加了一个前提条件:这次抛掷出的点数为奇数。

生活中这种使用场景更多,我们一般不会直接去推断一个事件发生的可能性,因为这样实际意义并不明显,而且也不容易推断出结果,比如我们问你今天下雨的概率是多大?你可能是一头雾水,什么地点?什么月份?当日云层的厚度?这些条件都没有告诉,我想是无法给出一个有意义、有价值的合理推断的。

而且在实际情况下,一个事件一般而言也不会是孤立的发生,也都会伴随着其他的一些事情或表现一同出现,单独的谈一个事件的概率,一般而言也是不存在的。

因此,在实际的应用中,我们更关心的是条件概率,也就是在给定部分信息的基础上对试验结果的推断。这些给定的信息就是我们附加的条件,是我们研究时关注的重点。

这里,我们来具体描述一下条件概率:

假设我们已经知道给定的事件 $B$ 发生了,在此基础上希望知道另一个事件 $A$ 发生的可能性,此时我们就需要构造出条件概率,它需要先顾及事件 $B$ 已经发生的信息,然后求出事件 $A$ 发生的概率。

这个条件概率描述的就是给定事件 $B$ 发生的情况下,事件 $A$ 发生的概率,我们专门把他记作: $P(A|B)$

那我们回到投掷骰子的问题中来,在投出奇数点数骰子的前提下,投出 $5$ 的概率有多大?奇数点数一共有 $\{1,3,5\}$ 三种,其中出现 $5$ 的概率是 $\frac{1}{3}$,很明显,和单独问投出点数是 $5$ 的概率结果是不同的。

下面我们来抽象一下条件概率的场景。

我们再回到最简单、最容易理解的情景下来看,即在古典概率的模式下来分析:假定一个试验有 $N$ 个等可能的结果,事件 $A$ 和 $B$ 分别包含 $M_1$ 个和 $M_2$ 个结果,这其中有 $M_{12}$ 个结果是公共的,这就是同时发生事件 $A$ 和事件 $B$,即 $A\cap B$ 事件所包含的试验结果数。

形象的描述一下上述场景,如图所示:

那我问你,单纯的发生事件 $A$ 和事件 $B$ 的概率是多少?你肯定是脱口而出,分别是 $\frac{M_1}{N}$ 和 $\frac{M_2}{N}$ ,那进一步到条件概率中来,已知在事件 $B$ 发生的前提条件下,事件 $A$ 发生的概率是多少?

则此时,我们的整体考虑范围由最开始的 $N$ 个全部的可能结果局限到现在的 $M_2$ 个结果,即 $B$ 事件发生的结果范围,而这其中只有 $M_{12}$ 个结果对应事件 $A$ 的发生,那么我们不难计算出,条件概率 $P(A|B)=\frac{M_{12}}{M_2} $ 。

为了更加深入的挖掘这里面的内涵,我们进一步的对条件概率的式子 $P(A|B)=\frac{M_{12}}{M_2}$ 进行展开:

$P(A|B)=\frac{M_{12}}{M_2}=\frac{(M_{12}/N)}{(M_2/N)}=\frac{P(AB)}{P(B)}$

由此,我们得到了条件概率的一般定义:$P(A|B)=\frac{P(AB)}{P(B)}$

2.两个事件的独立性

我们在上面的例子中,进一步的进行分析,我们发现事件 $A$ 的无条件概率 $P(A)$ 与其在给定事件 $B$ 发生下的条件概率 $P(A|B)$ 显然是不同的,即:$P(A|B)\neq P(A)$ ,而这也是普遍的一种情况,这两个概率值一般都是存在着差异的。

其实,这反映了两个事件之间存在着一些关联,假如满足 $P(A|B)>P(A)$,则我们可以说事件 $B$ 的发生使得事件 $A$ 的发生可能性增大了,即事件 $B$ 促进了事件 $A$ 的发生。

但是如果 $P(A)=P(A|B)$ 呢,这种情况也是存在的,而且这是一种非常重要的情况,他意味着事件 $B$ 的发生与否对事件 $A$ 发生的可能性毫无影响。这时,我们就称 $A$ , $B$ 两个事件独立,并由条件概率的定义式进行转换可以得到:

$ P(A|B)=\frac{P(AB)}{P(B) } \Rightarrow P(AB)=P(A|B)P(B)=P(A)P(B)$

实际上,我们拿这个式子来刻画独立性,比使用表达式 $P(A)=P(A|B)$ 要更好一些,因为 $P(AB)=P(A)P(B)$ 这个式子不受 $P(B)$ 是否为 $0$ 的制约。

由此我们说,如果 $A$ 和 $B$ 两个事件满足 $P(AB)=P(A)P(B)$,则称事件 $A$ 和事件 $B$ 独立。

3.从条件概率到全概率公式

首先假设 $B_1,B_2,B_3,...,B_n$ 为有限个或无限个事件,他们之间两两互斥且在每次试验中至少发生一个,我们用图直观的表示如下:

top Created with Sketch.