基于连通性的聚类,也称为层次聚类,其核心思想是对象与附近的对象比与较远的对象更相关。这些算法根据距离将“对象”连接起来形成“簇”。簇可以大致通过连接簇各部分所需的最大距离来描述。在不同的距离处,将形成不同的簇,可以使用树状图表示,这解释了“层次聚类”这个常用名称的由来:这些算法不提供数据集的单一分区,而是提供以一定距离相互合并的簇的广泛层次结构。在树状图中,y 轴标记簇合并的距离,而对象沿 x 轴放置,以使簇不会混合。

基于连通性的聚类是一整套方法,它们的区别在于计算距离的方式。除了通常的距离函数选择之外,用户还需要决定要使用的链接标准(因为一个集群由多个对象组成,所以有多个候选对象来计算距离)。常见的选择包括单链接聚类(对象距离最小)、完全链接聚类(对象距离最大)以及 UPGMA 或 WPGMA(“带算术平均值的无加权或加权对组方法”,也称为平均链接聚类)。此外,层次聚类可以是聚合的(从单个元素开始,将它们聚合成集群)或分裂的(从完整的数据集开始,将其划分为分区)。

✍️出现

Python鲁汶意外莱顿复杂图拓扑分解算法

https://embed.notionlytics.com/wt/ZXlKM2IzSnJjM0JoWTJWVWNtRmphMlZ5U1dRaU9pSlhiRWhvWlV4VVQxbHNjMlZYV2tKbU9URndaU0lzSW5CaFoyVkpaQ0k2SWpnNE5HVmpOVE5oWkRVd1l6UXlZalk0TW1VNE1UZzFaakl3TnpSbE1XUmtJbjA9