分布单值概述

来源:互联网 发布:sn ty gm js是什么 编辑:程序博客网 时间:2024/05/19 05:34

1.期望:连续随机变量的加权平均值。如果下列积分有定义的话,即:

\int|x|dF(x) < \infty

定义X的期望(均值,一阶矩)为:

E(X) = \mu = \int{xdF(x)} = \int{xp(x)dx}

对于离散随机变量为:

\sum_x{xp(x)}

期望的性质:
- 线性运算:
math
E(aX+b) = aE(x) + b

- 加法法则, 设xi是随机变量,a_i是常量:
math
E(\sum_ia_ix_i) = \sum_ia_iE(x_i)

- 乘法法则,设xi是相互独立的随机变量:
math
E(\prod^N_{i=1}X_i) = \prod^N_{i=1}E(X_i)

2.众数(mode):设随机变量X有密度p(x),且存在x0满足
math
x_0 = {arg max} p(x)

则称x0为X的众数,刻画随机变量出现次数最多的位置

期望,中值和众数都被称为位置参数。
- 当随机变量为高斯分布(即正态分布)时,三者相等
3.中值(median):分布的中值可是为分布的中间,即在其上下的概率均为0.5:

Median(X):=x^*:P(X>=x*) = 0.5 = P(X<=x*)

4.分为函数(quantile):随机变量X的CDF为F,CDF的反函数为分位函数(quantile function)定义为(inf代表最小值):

F^-1(\alpha) = inf\{{x:F(x)>=\alpha}\}

其中αϵ[0,1].若F严格递增且连续,则F1(α)为一个唯一确定的实数x,使得F(x)=α. F1为增函数

中值/中位数:F1(0.5)

5.方差(variance):
E(Xk)<inf, X的k阶矩定义为E(xk)
若X有均值μ,则其方差(二阶中心矩)为:

\sigma^2 = V(X) = E(X-\mu)^2 = \int(x-\mu)^2dF(x) = E(x^2) + E(\mu^2) - 2E(x)E(\mu) = E(x^2) - \mu^2

标准差(standard deviation)

\sigma = \sqrt{V(X)}

性质:
- V(X)=E(x2)μ2
- 设a,b为常数, V(aX+b)=a2V(x)
- 如果Xn独立,an为常数,则V{Ni=1aiXi}=Ni=1a2iV(xi).期望的加法不用互相独立,不独立随机变量考虑协方差

6.IQR(Interquantile Range)四分位矩: 25%到75%分位数之间的区间
- 中值比期望更鲁棒
- 四分位矩比方差更鲁棒