【通俗向】假设检验(三):卡方检验和t检验

来源:互联网 发布:mac打字左下角 编辑:程序博客网 时间:2024/06/10 07:19

国际惯例,先看几个例子:

  1. 假设抛硬币,抛了12次,出现正面为1,反面为0,如果出现正面的次数为10次,问这个硬币是否均匀?
  2. 假设有一个正四面体,出现四个面的分别记为1,2,3,4;抛了120次,如果出现这四个面的次数为30,30,40,20的话,问这个四面体是否均匀?
  3. 假设有一个灌铅的正四面体(赌博用),厂商声称其中出现4的概率为70%,其他三个面为10%,那么抛了120次,四个面的概率为(1,2,3,4)为10,10,20,80,问这个四面体合不合规?
  4. 假设赌博的时候,用两个之间连根线的硬币A和B(不一定是均匀硬币),出现正面为1,反面为0,一共抛了120次,A出现100次正面,B出现90次正面,问这个绳子是否对两个硬币的分布造成影响?
  5. 在赌博的时候用之前的正四面体(不一定是均匀四面体),并用线连接起来,一共抛120次,两个四面体A和B出现(1-4)点数的次数为A:20,20,40,40;B:30,20,30,40 问这个两个四面体的分布是否独立?
  6. 在一个大风天里玩三个骰子(-_-),抛了A四面体骰子12次,B抛了24次,C抛了32次,A出现的四个面为(3,3,3,3),B为(6,7,5,6),C为(8,8,6,7),问这三个筛子的分布是否相互独立?
  7. 如果刚开始是一个四面体骰子,扔了100次,出现1234的次数别是20,20,25,35;后来厂商进行改进说能扔出更多的4,扔了200次,发现出来1234的次数为10,20,30,140,问:
    1:第一个骰子是均匀分布的么?
    2:第二个骰子真的和第一个不一样么?
    3:第二个筛子出现4的概率真的比第一个大么?

以下是问题的解答,其中统一取p=0.01,也就是小于1%的话,认为事件不可能发生

1:p=C(12)(10)* (1/2)^10*(1/2)^2=0.016;

也就是说有1.6%的概率发生这件事情,既然我们之前取得概率是1%,所以可以接受这个巧合

2: 最简单的卡方检验

x2<-c(30,30,40,20)p2<-rep(0.25,4)chisq.test(x2,p=p2)

pvalue=0.08,无法拒绝原假设,也就是有8%的概率出现以上的情况。

3:一维卡方

p3<-c(0.1,0.1,0.1,0.7)x3<-c(10,10,20,80)chisq.test(x3,p=p3)#结果:Chi-squared test for given probabilitiesdata:  x3X-squared = 6.1905, df = 3, p-value = 0.1027

可以看到p=0.1,所以可以接受原假设

4:二维卡方检验,不再检验样本和理论频率,而是两个样本之间的检验;

b<-matrix(c(100,20,90,30),nrow=2)b<-as.table(b)rownames(b)<-c(0,1)colnames(b)<-c('A','B')chisq.test(b)

看出P=0.15,同样无法拒绝原假设

5:同样的二维,但不是普通的2*2卡方,代码如下

b<-matrix(c(20,20,40,40,30,20,30,40),ncol=2)b<-as.table(b)rownames(b)<-c(1,2,3,4)colnames(b)<-c('A','B')chisq.test(b)

结果

Pearson's Chi-squared testdata:  bX-squared = 3.4286, df = 3, p-value = 0.3301

p=0.33,说明AB间有关联。

6:同样扩展到三个变量的独立性检验:

b<-matrix(c(3,3,3,3,6,7,5,6,8,8,6,7),ncol=3)b<-as.table(b)rownames(b)<-c(1,2,3,4)colnames(b)<-c('A','B','C')chisq.test(b)

结果

Pearson's Chi-squared testdata:  bX-squared = 0.17829, df = 6, p-value = 0.9999

P值很大,不能拒绝三个没有相关的假设,也就是不独立

7:这个问题涉及到卡方检验和t检验的本质,卡方检验主要检验几个变量之间的独立性,也就是有没有关联,而t检验更多的检验显著性,也就是几组数据到底一不一样。也就涉及到相关性和显著性的问题。

比如这个例子,扔第一个骰子100次,又扔了第二个骰子200次,如果是一个骰子的话,这两个骰子出现的次数应该保持近似一致,如果检验后发现出现一致的概率很低,那么可以拒绝原假设(也就是不一致);但是两个骰子本身的性质(均匀分布或者灌铅骰子)和这一个骰子的实验结果展现的次数有关系。也就是说卡方检验检验的是次数,而t检验检验的是

再举个更通俗的例子,假如身高高的人一般体重都大,那么我取了10个身高段“150,155,160…200cm”1000个人,然后按照体重分为10个体重段,比如‘50kg,60kg….’,然后做成列联表,最后按照卡方检验求p值,发现p值=0.001,也就是说如果没有联系的话,实验这么多次出现这个结果的概率为0.001,显然这么小的概率可以认为不能发生,所以是有关联的。(Fisher检验更精确的说明这个论点)。

而t检验可以利用操作均值的差异,检验1000个样本,身高放在A列,体重放在B列,从而看A,B列的差异,如果p=1 则说明A和B没有差异。

所以卡方检验和T检验的前提条件(原假设)是对立的:
卡方检验:假设没有相关性
T检验:假设没有差异(相等)

刚才的例子,举个n=100的样本,代码如下
F检验

a<-c(35,15,41,9)dim(a)<-c(2,2)rownames(a)<-c('high','low')colnames(a)<-c('heavy','light')chisq.test(a)

首先建立一个tablea,a,假设超过180cm叫high,超过90kg叫heavy,则这个列联表如下:

      heavy lighthigh    35    41low     15     9

检验结果如下:

Pearson's Chi-squared test with Yates' continuity correctiondata:  aX-squared = 1.3706, df = 1, p-value = 0.2417

p=0.24,不能拒绝没有相关性的检验,也就是相关

相似的如果按照第二个t检验,需要出身高和体重的数据,模拟一下:

b1<-seq(160,200,5)set.seed(100)b2<-b1/2+rnorm(9)t.test(b1,b2,mu=80)

其中b1是从160-200cm中,每隔5cm取一个序列,b2是体重值,简单起见,用b1/2加上一个随机数,mu=80,是b1的均值-b2的均值=80这个假设,也就是线性分布。

结果为:

Welch Two Sample t-testdata:  b1 and b2t = 1.9572, df = 11.739, p-value = 0.07453alternative hypothesis: true difference in means is not equal to 8095 percent confidence interval:  78.84237 101.11757sample estimates:mean of x mean of y 180.00000  90.02003 

可以看到p=0.07,不能拒绝原假设,也就是两个值的差值在80这个结论可以成立。

最后以最后一题的结论结束这篇文章:
1: 代码如下:
p7<-rep(0.25,4)
x7<-c(20,20,25,35)
dim(x7)<-c(2,2)
chisq.test(x7,p=p7)

结果为

Pearson's Chi-squared test with Yates' continuity correctiondata:  x7X-squared = 0.37879, df = 1, p-value = 0.5383

p值为0.5,说明无法拒绝,所以是均匀分布。

2:代码如下:

x7_2<-c(10,20,30,140)x7<-c(20,20,25,35)t.test(x7,x7_2)

结果:

Welch Two Sample t-testdata:  x7 and x7_2t = -0.82015, df = 3.0818, p-value = 0.4708alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: -120.56751   70.56751sample estimates:mean of x mean of y        25        50 

因为p=0.47,也就是说有0.47的概率均值相等,所以不能拒绝原假设,也就是没有显著差别。

3:

x7_3<-c(140,60)x7_4<-c(35,65)t.test(x7_3,x7_4,alternative='greater')

p=0.2,所以不能认为后者比前者大,有可能是随机造成的

The end

0 0
原创粉丝点击