相关分析流程总结,原来是这样的!

作者&投稿:殷勤凭 (若有异议请与网页底部的电邮联系)
~


为了帮大家快速度过新手期, 我们整理了一份常见分析方法的流程总结。

 

其中包括每种分析方法的分析流程,以及每个环节中可能出现的问题及应对方法。不会分析的同学可以按照图中的流程一步步操作,就能得到准确可靠的结果。

 

本文将介绍的是相关分析的分析流程,即SPSSAU通用方法中的“相关”。

相关分析流程总结

 

为了便于理解,我们先简单介绍下相关分析,然后按照分析流程顺序,对每一步可能会涉及的问题进行简要说明。

 

 

使用相关分析,通常是研究两个变量的相关性情况。比如学习成绩和听课质量的关系;员工敬业度与薪资的关系等等。

 

 

相关分析的适用范围很广,理论上讲,凡是考察两个变量相关性,都可以叫做相关分析。

 

但依据习惯,我们通常说的相关分析,多指的是两个定量数据之间的简单相关分析,这就要求两个变量都是定量数据,即选项数字大小要可比较,且有实际意义。

 

如果两个数据均为定类数据,则不可以直接用相关分析,而应该使用卡方分析测量相关性(准确说应该是差异分析)。

 

如果一个是定类数据,一个是定量数据,则应该使用方差分析。

 

这种误用常见于分析背景信息题与核心研究题项的相关情况。

 

 

相关分析要求数据服从正态分布,因此分析前需要检验数据的正态性。

 

正态性有多种检验方法,常见方法如:正态图、正态性检验、P-P图/Q-Q图等。

由于相关分析对正态性要求比较宽松,即使违反计算结果也比较稳健,只要数据基本满足正态即可。如果数据完全不正态,则可以用Spearman相关系数。

 

 

当两个定量数据在散点图上的散点呈现直线趋势时,就可以认为两者存在直线相关趋势,这也是相关分析的一个基本前提。

 

 

 

例如上图,当X增大时,可以比较明显地看出Y会随着增大,说明X和Y之间有着正向相关关系。如果是负相关,散点图会呈现随着一个变量值的增加,另一个变量值降低的趋势。

 

非线性关系

如果数据呈现非线性的趋势,可以选择对变量进行数据转换(如对数转换),或是使用Spearman相关系数进行分析。

 

 

相关分析对极端值较为敏感,异常值会影响分析结果。需要在分析前查看是否存在异常值,保证结果的可靠性,此步可以和上一步一起通过散点图查看。

 

存在异常值

如果存在极端值,需要在分析前进行剔除。使用方法:SPSSAU数据处理->异常值。

 

这是上一步中得到的散点图,有一个明显的离群值,研究者需要根据情况选择保留或删除。建议按照SPSSAU异常值帮助手册的说明,对异常值进行处理。

 

 

 

当完成以上步骤且满足相关分析的分析条件后,即可进行相关分析。点击‘通用方法’-‘相关’。

这时又出现一个问题。SPSSAU提供了三种相关系数,分别是Pearson、Spearman,Kendall相关系数,该选哪一种呢?

 

多数情况下,SPSSAU建议使用pearson相关系数。如果数据不满足正态性或不满足线性关系,可以考虑使用Spearman相关系数。

 

Kendall相关系数用于判断两个变量的等级相关性,是否具有一致性,比如评委打分,数据排名等。

 

关于三种相关系数的比较具体可以查看相关分析帮助手册。

 

 

终于到了分析这一步了。相对于其他分析软件,SPSSAU的操作相对简单,将变量从左侧拖拽到分析项处,点击‘开始相关分析’即可。

 

 

分析项X可选

需要特别强调的一点是,相关分析通常不会特别区分哪个变量是X,哪个变量是Y。因此分析时,常常是直接把分析项都放入“分析项Y(定量)”里即可。

 

 

如果有明确的X、Y可以分开放置,两种放置方法只在表格的展示格式上有区别,结果是一样的。

 

指标解读

 

分析步骤可参考SPSSAU输出结果中的“分析建议”及“智能分析”。

 

 

需要注意的是相关系数代表变量之间的相关程度,相关系数越大,说明相关程度越紧密。

 

P值用于判断相关系数是否有统计学意义,P<0.05即说明变量间有相关关系,P值并不代表相关关系的强弱。

 

平均成绩、能力评分两个分析项交叉处的数字代表相关系数,而星号代表P值。一个星号代表P<0.05,两个星号代表P<0.01。如果没有星号,则说明P值>0.05。

 

 

相关分析的结果并不能代替回归分析,而相关分析通常是作为回归分析的基础,保证在有相关性的前提下,才可能有回归影响关系。

 

因此后续可以通过回归分析,进一步得到影响关系和具体的函数表达式。

 

 

 

以上就是相关分析的分析流程梳理。理论上都应该按照上述步骤进行分析,但在实际过程中,即使忽略其中的步骤,也能得到稳定的结果。

 

因此即使不按照步骤分析,也没有问题,而对于没有分析经验的研究者,SPSSAU建议按提供的步骤进行分析,才是最保险的做法。




齿轮传动效率的测定与分析实验中一个问题:阐述该系统机电一体化的特点...
答:在允许的条件下,齿轮转速越高、扭矩越大(传动功率越大),则效率越高;润滑油油温越高,效率越高;传动比越大,效率越低,当传动比接近1时,效率较高。上述为齿轮试验时,根据测量到的数值,得到的定性结论。

ERP是什么?
答:可以简单的说:企业资源计划是从企业的“人,财,物,时间,空间,制度经验,供方资源,客户资源”等资源角度做出如何协同作业,快速反应,成本最低,效率最高,资源优化等作业。会有好多相关的输入单据及自动流程单据。最后得到各部门的相关分析表数据等。这里就简写这么多,可以详细参与ERP方面的书,那里...

初中化学如何快速提高?
答:在学习的时候需要以书本为重点,需要完全的读懂课本,这是学习化学的基本,所以需要做到预习,阅读等,当然在看课本的过程淡妆不可以忽略小字以及图表等等,初中化学的内容与生活是有一定的关系的,所以在我们学习的同时需要关联一下实际,从身边发现关于化学的知识,这样可以让其更爱学习。学习方法总结 4、...

网络架构师是什么工作
答:平时的工作就是负责网络技术架构选型、并主导功能模块设计、数据结构设计、对外接口设计;负责与相关技术合作团队的技术协调;对各种前瞻技术进行预研并形成企业内部是否引入以及如何引入的建议;负责现有产品的的运营数据分析、用户反馈收集和功能优化;负责跟踪竞争对手动态、新产品调研分析;负责协调网站产品的创意、策划、改版、...

怎样快速提高初三化学成绩?
答:学方程式的书写及其相关计算等,是每次试题的核心内容,有一个地方弄不清楚,就有可能造成学习上的困难,有几个弄不清楚,就会导致成绩下降。有任何不理解的地方,经过短时间的思考后要马上去问老师,认真听老师的分析,纠正自己理解上的偏差。做到这一点,你就会发现,甚至顿悟:“原来是这样啊!”那些...

在企业里面,请问什么叫GB、BB教育?
答:是一些牛x企业自己做的一项能力认证考试。主要是针对商业项目管理。绿带是初级培训。黑带是高级培训。不同的企业的GB、BB的内容不太一样 总的来说包括:提供在与跨专业团队合作过程中所必需的重要支持性培训,包括确立和权衡问题,分析根本原因,实施改进措施并在新的层次进行调控的能力训练。培养组织能力...

与互联网相关专业有哪些?
答:与互联网相关的专业列举如下:1、电子商务应用、动漫艺术设计、数码影视设计、网络高级技术工程、网站开发高级工程、软件开发工程、环境艺术设计、广告传媒设计;2、界面工程、前端架构(分偏重JS和CSS两个方向)、信息审核 、网站策划 、营销策划、互联网运营 、数据分析、系统维护(UNIX,LINUX,WINDOWS)、...

初三如何快速提高化学成绩的方法
答:有任何不理解的地方,初三学生经过短时间的思考后要马上去问老师,认真听老师的分析,纠正自己理解上的偏差。做到这一点,你就会发现,甚至顿悟:“原来是这样啊!”那些平时困绕你的许多初三化学问题,答案原来就在课本上!二、理解双基,掌握化学用语 1、所谓“双基”即指初三化学基本概念和基本理论,是...

solidworks有限元分析准吗???
答:solidworks有限元分析是很准的。Solidworks软件功能强大,组件繁多。 Solidworks有功能强大、易学易用和技术创新三大特点。SolidWorks 能够提供不同的设计方案、减少设计过程中的错误以及提高产品质量。SolidWorks 不仅提供如此强大的功能,而且对每个工程师和设计者来说,操作简单方便、易学易用。而且solidworks还使用...

下表是科学家对某生态系统进行能量分析后得到的相关数据,其中净同化量...
答:(1)463 61.4 流入生态系统的总能量是生产者固定的能量,用于植物生长发育的能量=463-96-293-12.6=61.4 (2)17.2% 该湖植物未利用的能量太多 过程: 63/(463-96)*100% 因为题目给出的28.5%也是这么算的 (3) 抵抗力 次生 快 ...