『数据挖掘、机器学习』 常用算法思路、原理、公式、优缺点
来源:互联网 发布:2017年淘宝双十一 编辑:程序博客网 时间:2024/06/09 23:03
1、朴素贝叶斯分类算法
思路:通过计算在已知样本特征 X 下,该样本被分类为 Ci 类的概率,并取取得最大的概率的类为该样本所属分类
假设:假设每个特征相互独立
公式:
已知 X=(x1,x2,...,xn) , y=(C1,C2,...,Cm) , X 是 n 维向量,y 是 m 维向量
P(Ci|X)=P(Ci)∏nk=1P(xk|Ci)∑mi=1P(Ci)P(X|Ci)(1)
(1) 式中的分母由于对于每个 (1) 式来说都是相同,可以在实际计算中省略不使用
另外 P(X|Ci) ,由于 X=(x1,x2,...,xn) ,故 P(X|Ci) 可写成 P(x1,x2,...,xn|Ci) ,
而 P(x1,x2,...,xn|Ci) 又可以写成 ∏nk=1P(xk|Ci) 故 (1) 式可改写为:
P(Ci|X)=P(Ci)∏nk=1P(xk|Ci)∑mi=1P(Ci)∏nk=1P(xk|Ci)(2)
由 (2) 式的分母可以明显看出对于每一个样本 X 来说,分母都是相同的。
优点:方法简单、准确率高、计算速度快
缺点:假设每个特征相互独立的假设过强,不太符合实际;需要知道先验概率;样本数据量要比较多,这样得到的后验概率才比较准确
0 0
- 『数据挖掘、机器学习』 常用算法思路、原理、公式、优缺点
- 数据挖掘常用算法优缺点分析
- 数据挖掘常用算法优缺点分析
- 机器学习&数据挖掘算法
- 机器学习常用算法优缺点比较
- 常用的机器学习算法优缺点
- 常用机器学习算法优缺点及其应用领域
- 数据挖掘和机器学习中距离和相似度公式
- 机器学习算法原理和思路
- 常用的机器学习&数据挖掘知识点
- 常用的机器学习&数据挖掘知识点
- 常用的数据挖掘&机器学习知识点
- 机器学习&数据挖掘常用知识点
- 数据挖掘、机器学习基础算法
- 机器学习&数据挖掘 常见算法
- 经典机器学习&数据挖掘算法
- 机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 常用模型汇总
- 数据挖掘&机器学习
- .tar.bz2文件解压命令
- SQL关键字转换大写核心算法实现
- 婚姻默想:(五)
- 修改bugzilla template
- 分别是select poll epoll
- 『数据挖掘、机器学习』 常用算法思路、原理、公式、优缺点
- ecshop修饰符preg_replace/e不安全的几处改动
- 存储过程学习-加减乘除
- Spring AOP详解
- 安卓仿手机联系人右侧快速搜索菜单自定义View
- iOS实现图形编程可以使用三种API
- 算法练习
- “三天打渔,两天晒网”,从2010年1月1日开始,计算后来的任意一天是打鱼还是晒网
- Java Keytool工具简介