《01-SPSS软件聚类分析过程的图文解释及结果的全面分析.docx》由会员分享,可在线阅读,更多相关《01-SPSS软件聚类分析过程的图文解释及结果的全面分析.docx(13页珍藏版)》请在优知文库上搜索。
1、SPSS聚类分析过程聚类的主要过程一般可分为如卜.四个步骤:1 .数据预处理(标准化)2 .构造关系矩阵(亲疏关系的描述)3 .聚类(依据不同方法进行分类)4 .确定最佳分类(类别数)SPSS软件聚类步骤1 .数据预处理(标准化)Analyze(分析)-QaSSify(分类,归类)HierachicalClUSterAnaIySiS(层序聚类分析)Method(方法,条理,)然后从对话框中进行如下选择从TranSformVaIUeS框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:ZscoresNoneZscoresRange-1to1Range0to1Maximummagni
2、tudeof1Meanof1StdndarddeviationOf1标准化方法说明:None:不进行标准化,这是系统默认值;ZScores(Z-Scores,英文名又叫StandardizedPopulationData,是以标准差单位来表现的一组视察值):标准化变换;Range-1to1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且MMethod然后从对话框中进行如下选择常用测度(选项说明):Euclideandistance:欧氏距离(二阶MinkOWSki距离),用途:聚类分析中用得最广泛的距离;SquaredEucideandistance:平方欧氏距离;Cosine:夹角
3、余弦(相像性测度;Pearsoncorrelation:皮尔逊相关系数;3 .选择聚类方法SPSS中如何选择系统聚类法常用系统聚类方法a) Between-groupslinkage组间平均距离连接法方法简述:合并两类的结果使全部的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离b) Within-groupslinkage组内平均连接法方法简述:两类合并为一类后,合并后的类中全部项之间的平均距离最小C)Nearestneighbor最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d) Furthestneighb
4、or最远邻法(最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e) Centroidclustering重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号变更频繁,计算较烦。f) Medianclustering中位数法方法简述:两类间的距离既不采纳两类间的最近距离,也不采纳最远距离,而采纳介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采纳。g) WarcrSmethod离差平方和法方法简述:基于方差分析
5、思想,假如分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必需是欧氏距离。谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应依据探讨的目的来确定适当的分类方法,并提出了一些依据谱系图来分类的准则:A.任何类都必需在接近各类中是突出的,即各类重心间距离必需极大B.确定的类中,各类所包含的元素都不要过分地多C.分类的数目必需符合好用目的D.若采纳几种不同的聚类方法处理,则在各自的聚类图中应发觉相同的类实例分析AnalyzeQraphsUtilitiesHindowHelpRorts
6、Dg,scriptiveStatisticsCompareMeansGeneral1.inearModelCorrelateRegressionK-MeansCluster.Discriminant.HierarchicalCluster.ClassifyDataReductionScaleHonparametricTestsMultipleResponse生成树形图生成冰柱图=JPlCts-I凝聚状态表,显示聚类过程各项间的距离矩阵类成员栏Statistics.I结果分析:(方法选择如下)CkjsterMethod:Measure行Intervai:rCounts:rBinary:arsme
7、thodIEucIideandistancef,over2IRoot:?ChkSuife11waureISquaredEucMdeanflstar力CSCn1.lbTraDSformVQSStandardize:Zscores3GByyarlablerBycaseTransformMedSUr,rAbSoMegIeS1.CbangesignrRqscaIoto0111U2啜/腿自咖蟠A)FG1导肌.宙皆内沓FRAFFTlF三,C:11caycAT)11111AnnT)ata1nrj11Tnc113u2fifWnuhytn导出的word文档中聚类过程如下:RescaledDistanceClusterCombineCASE05101520251.abel如叭+-+B2-+C3-+A1+E5+-+IF6+ID4+可看出聚类过程为如下表所示:分类过程统计表连结依次连结元素IBC2ABC3EF4EFABC5DABCEF