所有栏目

聚类分析统计量有哪些

已输入 0 字
优质回答
  • 聚类分析是研究“物以类聚”的一种科学有效的方法。做聚类分析时,出于不同的目的和要求,可以选择不同的统计量和聚类方法。

    系统聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。

    2023-10-23 11:30:45
  • 无论是R型聚类还是Q型聚类,关键是如何定义相似性。即如何把相似性数量化。聚类的第一步需要给出两个指标或两个样本间相似性度量的统计量。

    聚类分析中用来衡量样本个体之间属性相似程度的统计量以及指标变量之间属性相似度的统计量是不同的,前者用的统计量是距离系数,后者用的统计量是相似系款。

    距离系数的定义有很多,如欧式距离、极端距离、绝对距离等。

    相似系数的定义也很多,如相关系数、列联系数等。

    2023-10-23 11:30:45
最新问题 全部问题