人工智能中文网
  • 主页
  • 线代考研视频
  • 线性代数
  • Python机器学习与算法
  • 大数据与机器学习
  • Python基础入门教程
  • 人工智能中文网
    教程目录
    阅读:

    伯努利分布及计算公式(超详细)

    < 上一篇:泊松分布 下一篇:没有了 >
    伯努利分布(Bernoulli Distribution)是一种离散分布,在概率学中非常常用,有两种可能的结果:
    • 1 表示成功,出现的概率为 p(其中 0<p<1);
    • 0 表示失败,出现的概率为 q=1-p。
    这很好理解,除去成功都是失败,p 是成功的概率,概率 100% 减去 p 就是失败的概率。


    图 1 雅各布·伯努利

    伯努利分布是为纪念瑞士科学家雅各布·伯努利(Jakob Bernoulli)(图 1)而命名的。这里值得一提的是伯努利家族。瑞士的伯努利家族(也译作贝努力)是一个很伟大的家族,一个家族 3 代人中产生了 8 位科学家,后裔有不少于 120 位被人们系统地追溯过,他们在数学、自然科学、技术、工程乃至法律、管理、文学、艺术等方面享有名望,有的甚至声名显赫。

    伯努利分布的分布律如下:


    看上去像个分段函数是不是,它也可以写作:


    这两个写法其实说的是一回事,你自己可以把 n=0 和 n=1 分别带进去算一算。

    伯努利分布的应用需满足以下两个条件。
    1. 各次试验中的事件是互相独立的,每一次 n=1 和 n=0 的概率分别为 p 和 q。
    2. 每次试验都只有两种结果,即 n=0,或 n=1。

    如果不满足这两个条件,则分布不是伯努利分布。

    满足伯努利分布的样本有一个非常重要的性质,即满足下面公式:


    我们解释一下这个公式的含义。

    其中,X 指的是试验的次数,Cnk 指的是组合,也就是:


    这个公式表示,如果一个试验满足:


    的伯努利分布,那么在连续试验 n 次的情况下,出现 n=1 的情况发生恰好 k 次的概率为:


    其中,n=1 就是对应概率为 p 的情况。

    下面用一个小例子来说明。例如,张三参加英语雅思考试,每次考试通过的概率为 1/3,不通过的概率为 2/3。如果他连续考试 4 次,那么恰好通过 2 次的概率为多少?

    在这个例子里可以比较容易看到,P=1/3,n=4,k=2。代入公式:


    因此概率为 8/27。

    这个例子也可以用排列组合来计算。一共 4 次考试,2 次通过,一共有 6 种情况,如表 2 所示。

    表 2 通过的情况
    通过情况 第1次 第2次 第3次 第4次 通过情况 第1次 第2次 第3次 第4次
    1 通过 通过 不通过 不通过 4 不通过 通过 通过 不通过
    2 通过 不通过 通过 不通过 5 不通过 通过 不通过 通过
    3 通过 不通过 不通过 通过 6 不通过 不通过 通过 通过

    试着求每次的概率,情况 1,即第 1 次通过且第 2 次通过且第 3 次不通过且第 4 次不通过。这里千万不要漏掉后面两个条件,后面两次必须是不通过,否则条件就和公式不匹配了。

    那么,第 1 次通过,概率为 1/3,第 2 次通过,概率为 1/3,第 3 次不通过,概率为 2/3,第 4 次不通过,概率为 2/3。这 4 个条件都发生的概率为:


    同理,情况 2 到情况 6 的概率都是 4/81。所以最后的结果是:


    结果是完全一样的。

    对于满足伯努利分布的试验来说,用古典概型进行计算显得复杂和繁琐,尤其是 n 和 k 比较大的时候用古典概型来做就太不方便了。

    伯努利分布的应用场景其实远比这个例子丰富,读者有兴趣可以再继续寻找其他题目试解。
    < 上一篇:泊松分布 下一篇:没有了 >