主题模型相关的几个概念
来源:互联网 发布:ubuntu怎么安装php 编辑:程序博客网 时间:2024/06/11 09:03
一 基本概念
二 贝叶斯定理
假设有一所学校,学生中60%是男生和40%是女生。女生穿裤子与裙子的数量相同;所有男生穿裤子。现在有一个观察者,随机从远处看到一名学生,因为很远,观察者只能看到该学生穿的是裤子,但不能从长相发型等其他方面推断被观察者的性别。那么该学生是女生的概率是多少?
用事件
P(G) 表示一个学生是女生的概率。由于观察者随机看到一名学生,意味着所有的学生都可能被看到,女生在全体学生中的占比是 40% ,所以概率是P(G)=0.4 。注意,这是在没有任何其他信息下的概率。这也就是先验概率。后面我们还会详细讨论。P(B) 是学生不是女生的概率,也就是学生是男生的概率,这同样也是指在没有其他任何信息的情况下,学生是男生的先验概率。B 事件是G 事件的互补的事件,于是易得P(B)=0.6 。P(T|G) 是在女生中穿裤子的概率,根据题目描述,女生穿裙子和穿裤子各占一半,所以P(T|G)=0.5 。这也就是在给定G 的条件下,T 事件的概率。P(T|B) 是在男生中穿裤子的概率,这个值是1。P(T) 是学生穿裤子的概率,即任意选一个学生,在没有其他信息的情况下,该名学生穿裤子的概率。根据全概率公式P(T)=P(T|G)P(G)+P(T|B)P(B) ,计算得到P(T)=0.5×0.4+1×0.6=0.8 。
三 先验知识,先验概率,似然函数与后验概率
在贝叶斯统计中,先验概率分布,即关于某个变量
先验概率仅仅依赖于主观上的经验估计,也就是事先根据已有的知识的推断。例如,
在应用贝叶斯理论时,通常将先验概率乘以似然函数(Likelihood Function)再归一化后,得到后验概率分布,后验概率分布即在已知给定的数据后,对不确定性的条件分布。
(3) 似然函数(Likelihood function):
似然函数(也称作似然),是一个关于统计模型参数的函数。也就是这个函数中自变量是统计模型的参数。对于观测结果(4)后验概率:
在贝叶斯统计中,一个随机事件或者一个不确定事件的后验概率是在考虑和给出相关证据或数据后所得到的条件概率。例如上面例子,在"女生穿裤子和穿裙子的人数相等,所有男生穿裤子"的证据下的概率就是后验概率。可见后验概率是条件概率
四 4个分布
- 主题模型相关的几个概念
- 几个数据库的相关概念
- 几个数据库的相关概念
- 测试相关的几个概念
- 概念主题模型简记
- 主题模型相关
- (二) 几个RTOS相关的概念
- 和GUI相关的几个概念
- Oracle 与SQL相关的几个概念
- 关于软件测试的几个相关概念
- NP几个相关概念
- 几个网络相关概念
- 模型相关概念
- [ZT]有关电源的几个与功率相关的概念
- 关于“重定位”及其相关的几个概念
- GPU中与CUDA相关的几个概念
- IntelliJ IDEA 项目相关的几个重要概念介绍
- GPU中与CUDA相关的几个概念
- 2
- cocoapods 引入Alamofire 各种错误和解决
- Java的代码块
- 关于pingpp(招行一网通)-混淆
- JVM 总结
- 主题模型相关的几个概念
- 计算机网路之动态NAT配置
- 虚拟机克隆
- 灵活而奇特的C++语言特性——const(二)
- POJ 1191 棋盘分割(DP)
- java发送邮件
- 粗浅的科普java异常机制
- sql语句整理——查询
- 5 多项目构建