方差分析的基本概念

来源：互联网发布：完美假期周晨曦淘宝店编辑：程序博客网时间：2024/06/12 00:16

方差分析

方差分析（ANOVA）又称“变异数分析”或“F检验”，用于两个及两个以上样本均数差别的显著性检验。

方差分析是在可比较的数组中，把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量，采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和，这是一个很重要的思想。

方差分析的基本应用条件：

观察对象来自于所研究因素的各个水平之下的独立随机抽样
每个水平下的应变量应该服从正态分布
各水平的总体具有相同的方差

基本思想：通过分析研究中不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小。
方差分析是基于变异分解的思想进行的，在单因素方差分析中，整个样本的变异可以

看成有如下两个部分构成：
总变异=随机变异+处理因素导致的变异

在方差分析中，代表变异大小，并用来进行变异分解的指标就是离均值平方和，代表总的变异程度。

总变异可分解成两项。第一项是各组内部的变异（组内变异），该变异只反映随机变异的大小，其大小可以用各组的离均值方差和之和，第二项为各组均数的差异，它反映了随机变异的可能与课程存在的处理因素的影响之和，其大小可以用组间平方和来表示。
总变异的内容

方差分析的检验统计量可以简单理解为利用随机误差作为尺度来衡量各组间的变异，即

F = 组 间 变 异 测 量 指 标 组 内 变 异 测 量 指 标

两两比较方法的选择

两两比较方法的选择策略

方差分析模型常用的术语

因素
因素是可能对因变量有影响的变量，一般来说，因素会有不止一个水平，而分析的目的就是考察或比较各个水平对因变量的影响是否相同。
水平
因素的不同取值等级称作水平，例如性别有男、女两个水平。
单元（ Cell）
–单元亦称试验单位（ Experimental Unit），指各因素的水平之间的每种组合。指各因素各个水平的组合，例如在研究性别（二水平）、血型（四水平）对成年人身高的影响时，该设计最多可以有2*4＝8个单元。注意在一些特殊的试验设计中，可能有的单元在样本中并不会出现，如拉丁方设计。

元素（ Element）
–指用于测量因变量值的观察单位，比如研究职业与收入间的关系，月收入是从每一位受访者处得到，则每位受访者就是试验的元素
–一个单元格内可以有多个元素，也可以只有一个，甚至于没有元素。
• 这主要在一些特殊的设计方案中出现，如正交设计
均衡（ Balance）
– 如果在一个实验设计中任一因素各水平在所有单元格中出现的次数相同，且每个单元格内的元素数均相同，则该试验是均衡的，否则，就被称为不均衡。不均衡的实验设计在分析时较为复杂，需要对方差分析模型作特别设置才能得到正确的分析结果。

固定因素（ Fixed Factor）
–指的是该因素在样本中所有可能的水平都出现了。从样本的分析结果中就可以得知所有水平的状况，无需进行外推。
–绝大多数情况下，研究者所真正关心的因素都是固定因素。
•性别：只有两种
•疗法：只有三种
随机因素（ Random Factor）
–该因素所有可能的取值在样本中没有都出现，目前在样本中的这些水平是从总体中随机抽样而来，如果我们重复本研究，则可能得到的因素水平会和现在完全不同！
– 这时，研究者显然希望得到的是一个能够“泛化”，即对所有可能出现的水平均适用的结果。这不可避免的存在误差，需要估计误差的大小，因此被称为随机因素。

协变量（ Covariates）
–指对因变量可能有影响，需要在分析时对其作用加以控制的连续性变量
–实际上，可以简单的把因素和协变量分别理解为分类自变量和连续性自变量
– 当模型中存在协变量时，一般是通过找出它与因变量的回归关系来控制其影响
交互作用（ Interaction）
– 如果一个因素的效应大小在另一个因素不同水平下明显不同，则称为两因素间存在交互作用。当存在交互作用时，单纯研究某个因素的作用是没有意义的，必须分另一个因素的不同水平研究该因素的作用大小。

蒙特卡罗方法

*蒙特卡罗方法又称统计模拟法、随机抽样技术，是一种随机模拟方法，以概率和统计理论方法为基础的一种计算方法，是使用随机数（或更常见的伪随机数）来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系，用电子计算机实现统计模拟或抽样，以获得问题的近似解。*

0 0