Cf0cb5ede2693f33afd9679b171a733a
机器学习算法篇--贝叶斯分类器

概念回顾:

贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。
贝叶斯公式:

  • P(Y|X)= P(X|Y)P(Y)/P(X)

举例:

上篇文章讲了一个垃圾邮件分类的例子,有的同学反应说是太复杂了,要有一定的基础才可以看懂,能不能来个简单易懂的。好!满足同学们。咱们目标就是让大部分数学基础一般的同学理解算法,一步一步踏实前进,写文章不是为了炫耀作者的能力多强,而是要让看文章的人有所收获。
下面我们通过一个去医院看病的例子来讲解一下,某一天一个诊所来了6个病人,数据如下:

  • 症状 年龄 疾病
  • 流鼻涕 老年人 感冒
  • 流鼻涕 青年人 发烧
  • 头晕 中年人 低血糖
  • 头晕 中年人 感冒
  • 流鼻涕 小孩子 感冒
  • 头晕 小孩子 低血糖

现在又来了第七个病人,是一个流鼻涕的中年人,请问他换上感冒的概率有多少?
下面我们来分析一下,这个问题,其实就是求在“流鼻涕和中年人”这两个条件发生的情况下,感冒的概率是多少。那我们用贝叶斯公式代入,可得:

  • P(感冒|流鼻涕x中年人) = P(流鼻涕x中年人|感冒) x P(感冒) / P(流鼻涕x中年人)

这时我们用条件独立假设,流鼻涕和中年人都是独立的特征,公式可以变化为:

  • P(感冒|流鼻涕x中年人) = P(流鼻涕|感冒) x P(中年人|感冒) x P(感冒) / P(流鼻涕) x P(中年人)

接下来就是求每一个事件发生的概率,我们来分别求一下:

  • P(流鼻涕|感冒) = 2 / 3 ---> 三个感冒的人里面有两个流鼻涕的,所以是2/3
  • P(中年人|感冒) = 1 / 3 ---> 三个感冒的人里面有一个中年人,所以是1/3
  • P(感冒) = 1 / 2 ---> 六个人里面有三个感冒的,所以是1/2
  • P(流鼻涕) = 1 / 2 ---> 六个人里面有三个流鼻涕的,所以是1/2
  • P(中年人) = 1 / 3 ---> 六个人里面有两个中年人的,所以是1/3

整理后就变成了:

  • P(感冒|流鼻涕x中年人) = (2/3 * 1/3 * 1/2)/(1/2 * 1/3)= 2/3

最后得出结果,流鼻涕的中年人患上感冒的概率是 2/3

总结:

贝叶斯分类器的基本原理:在统计资料的基础上,依据某些特征条件独立假设,计算各个类别的概率,从而实现分类。

© 著作权归作者所有
这个作品真棒,我要支持一下!
关于专栏:每个人学习都应该有一个属于自己的思维模型,我的思维模型就是把一个东西拆分,拆分,再拆分,直到不能拆分后再...
4条评论

简单易懂

⊙∀⊙!,我居然看,,看懂了

作者是自学的机器学期,还是在学校里学的呢

#3楼 @胖大海 前期是在工作中自学,后面参加了七月在线的培训,在名师寒小阳老师的指导下入门了,之后针对公司的已有业务开始应用机器学习做推荐系统。

top Created with Sketch.