为什么要进行方差齐性检验?来自大家的讨论,数据分析网整理发布。
【楼主】
方差齐性检验是方差分析的重要前提,是方差可加性原则应用的一个条件。
方差齐性检验是对两样本方差是否相同进行的检验。
方差齐性检验和两样本平均数的差异性检验在假设检验的基本思想上是没有什么差异性的。只是所选择的抽样分布不一样。方差齐性检验所选择的抽样分布为F分布。
【沙发】
方差分析的一个前提是方差齐性,可是看过了心理学报的相关文章,我所看到每一篇文章在进行方差分析的时候都没有进行齐性检验。这样做是否合理?
这个问题似乎statnet曾经讨论过,改天偶仔细找一找。
在百岛上得到tongji的回答后,肯定了方差齐性已经不是方差分析必要条件的认识,但是在道理上还是不太清晰。而且也不断地从各个领域讲方差分析的章节中获得方差齐性检验的必要性,大多建议对不齐方差的变量通过box-cox变换(公认最佳变换)转化为方差齐性的变量再计算。
看了lee的贴子,用激发了我对这个问题的探究,查找了一些书籍,得到如下系统认识,还望各位批评指正:
1、方差齐性的假定是在最小二乘估计的框架下谈的,大多数讲方差分析的教科书也都是在这个范畴(框架)内谈的,所以好像基本都同意方差分析必须要方差齐性。心理教育类的统计书更是如此,主要原因是心理教育类的研究方法总是滞后于其他自然科学;
2、在广义最小二乘估计框架下,并不要求处理间方差齐性。而在spss等统计软件中已经是在广义最小二乘估计解决方差分析计算问题。
所以,很多人即使对这个问题没有认识,也不影响他使用方差分析的正确性。不过,在选择多重比较方法的时候,就还需要有所取舍。在spss中陈列多重比较方法分为两个大类:一种是方差齐性下用的lsd等方法,另一类就是方差不齐时候用的方法。我对第二类目前总是苦于找不到相应的文献,tongji老师也没有给我指引文献的出处。
这类文献我也询问过广州spss办事处和medstatstar,但都没有得到指引,所以也就停留在spss的help的介绍水平。
如有任何线索指引,本人到是感激不尽!
从理论上讲,方差不齐性时,可以用另外一个公式计算的,好象不存在什么困惑吧!
那请写出你的公式和选择流程给我看看啦。
小虫,你所理解的问题与我们讨论的问题可能有一些差异
能否将你的理解具体写出来?
【板凳】
我想讲几点。
其一是说心理学报上的,很多研究者不给出方差齐不齐性的问题,可能有这样一个默认的传统,那就是齐性了就不讲了。而不齐性呢?反正我做到现在还没有碰到不齐性的方差分析。
其二就是不齐性时的计算问题。在平均数差异性检验时给出了一个总体方差不等时的计算公式,可能对探讨方差分析时的齐性检验有帮助(详见张厚粲的《心理与教育统计学》P242)。我很希望诸位当中的谁能依此而推导出一条适合方差分析不齐性时的计算公式,可谓一巨贡啊!
方差分析有三个假定的前提条件:总体呈正态分布;变异的可加性;各处理内的方差一致。照它的假定,如果不符合这三个条件的话,那就不能做方差分析了。这个当中可能很多搞研究的人就会把自己的研究假设成是符合前提的了,也就是说他们不考虑这些前提了,你们是这样认为吗?
顺便谈点个人的主观意见,既然是主观,可能就会有错误。可能就很少会出现不齐性的问题,不然不会引起学术界的讨论的?一般而言,如果在进行实验过程中,我们坚持科学的程序,那么就不会出现分析时的不齐性问题,随便胡掐一下,见笑了!
最后问一个问题,方差分析有显著性差异时,我们就要进行具体的平均数比较,书上讲的比较多的是进行Q检验法,这种方法是否是最好的检验具体的平均数比较的方法,有人也提出LSD其实就是T检验法,那么从理论上说,它就比Q检验法差了,是否是这样的呢?还有DUNCAN是依据什么原理的呢?一般而言,你们是用什么方法进行这种检验的?
在我所接触过的心理学界的研究者中,也有少数人注意过这个问题,但是都没有明确的认识,不知道是不是我接触的不够广,水平不够高。依我所见范畴,确实有很多的研究者即使意识到齐和不齐的问题,也就当作看不见混了过去。如果是这样默认三个前提,怎么也说不过去的吧。
另外,我想说应该把哪些书做依据的问题。张厚粲、孟庆茂、冯伯麟老师的书确实有其独到的地方,但由于成书年代较早(80年代初),也没有经过修订。不符合统计最新发展的特点日益明显,也急需有修订版本或有替代的书。但可惜目前在心理和教育学界并没有出现这样一本书,所以如果我们求证一个问题也应该找那些最新出版的书作为依据。现实状况是,这个问题我求证了3年以上,但是看的大多数中文书及少数英文书(工程统计、医学统计、管理统计等大类),对待这个问题普遍都是避重就轻,最多谈不齐时候的非参数处理方法或建议进行方差齐性变换。直到翻阅最新的一些专门阐述线性模型和方差分析的书籍时,才从只言片语中获得上贴的认识,所以我也希望大家能提供进一步的线索,让我不仅在道理上想通,也可让我明白推导过程。
Spss等软件是统计最新成果的集成,当然spss在统计功能上不及sas等全面,但是作为社会科学的研究也足够了。所以,正如lee的贴子里面说的,既然spss在多重比较中都把方法分为两大类,那自然是同意了方差齐不齐都可以做方差分析的了。我觉得这个逻辑虽然也有漏洞,但错误的可能性已经是非常非常小了。至于多重比较哪个方法更适合,lee已经有个贴子回答了这个问题。我查过在应用统计类刊物中有人探讨过方差齐的情况下各个多重比较方法的优劣,获得的认识就是在我们实际应用中,各个方法效果差异并不大,Bonferroni test; Tukey’s honestly significant difference test; LSD是spss建议选择的三种方法。
【地板】
如果在进行实验过程中,我们坚持科学的程序,那么就不会出现分析时的不齐性问题”。我认为造成这种看法的根本点在于忽视了随机现象的随机性。随机现象就是无法预知结果的现象,在我们的心理实验中的心理现象既然具有随机性,就必然会有各种各样的数据趋势,方差齐不齐是是实验设计无法控制的。
方法的适用性还和不同组的样本数是否相等有关,以前在一本有关环境的实用统计书里看到过(名字和出版社忘了,仿佛封面是浅色蓝的,北大人写的),对齐次性下的多重比较写的有些详细,有GT2,Duncan什么的,但是对不齐的时候也象没提。我的毕业论文也有这个问题,没办法选了个Games-Howell,心里不塌实。
最近仔细、认真地探讨了方差齐性对方差分析的影响,以及多重比较中方差不齐时的四种方法的差异。得到如下认识,跟大家探讨:
方差齐不齐在广义最小二乘法的框架下面,已经不是方差分析的条件,包括自变量之间的自相关性在广义最小二乘法也不是前提假设了。我们从spss8.0开始把菜单名字转换为general linear model就可以看出这种变化,即spss已经把方差分析放在了广义最小二乘法的框架下。由于这个认识是近二十年内发展起来的,所以大多数之前体系的教科书都没有涉及到这个内容,而且即使不齐也都有相应的非参数检验方法处理(对变量转换法似乎存在比较多的争议,建议慎用),所以也就姑且用着也不会出什么大毛病。
对多重比较中方差齐和不齐两类分法也是肯定的,这一点可以从sas最近出的一系列指导书中看到,可惜只能从互联网上看到书的目录,但是这也就足够了。从spss的技术支持和相应讨论组的资料分析建议使用Games-Howell检验,所以Lucy in the sky with diamond不必担心了。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。