系统聚类属于 无监督学习算法,其核心特点如下:
无监督学习属性 系统聚类不需要预先标记的标签或目标变量,通过数据本身的相似性进行分组。
层次聚类方法
通过构建树状结构(如树状图或谱系图)展示数据点间的层次关系,分为两种类型:
凝聚性聚类(Agglomerative Clustering): 自底向上合并相似样本,形成由小到大的簇; 分裂性聚类(Divisive Clustering)
应用场景
常用于生物学分类、社交网络分析、市场细分等领域,帮助揭示数据的内在结构或关联关系。
局限性
数据量较大时计算效率较低,通常适用于中小规模数据集。
与 监督学习(如K-means)不同,系统聚类不依赖标签,而是通过距离度量(如欧氏距离、曼哈顿距离)自动发现数据模式。
声明:
本站内容均来自网络,如有侵权,请联系我们。