首页 文章资讯内容详情

什么是 scipy.cluster.vq.kmeans2() 方法?

2026-06-02 1 花语

scipy.cluster.vq.kmeans2(data,k,iter=10,thresh=1e-05,minit=random,missing=warn,check_finite=True)-kmeans2()方法对一组观察向量进行分类通过执行k-means算法分成k个簇。为了检查收敛性,kmeans2()方法不使用阈值。它有额外的参数来决定质心的初始化方法,处理空集群,并验证输入度量是否只包含有限的数字。

下面给出了其参数的详细解释-

参数

数据-ndarray

它是N维中M个观察值的M×N数组。

k-int或ndarray

此参数表示要形成的簇数和要生成的质心。它被解释为在下面给出的两个条件的情况下使用的初始集群-

当minit初始化字符串是matrix时。

或者如果给出了ndarray。

thresh-浮动,可选

该参数代表阈值。如果自上次迭代以来的失真变化小于或等于该阈值,则算法将默认终止。

minit-str,可选

该参数表示初始化方法。下面给出了一些可用的方法-

random-它从具有均值和方差的高斯生成k个质心。根据数据估计均值和方差。

-此方法选择k个观察值,即从初始质心的数据中随机行。

++-这种方法,也称为小心播种,选择k个观察值,即kmeans++方法的行。

矩阵-矩阵方法解释初始质心的k参数(作为k乘M数组)。

缺少-str,可选

该参数表示处理空簇的方法。以下是可用的方法-

警告-这种方法,顾名思义,给出警告,然后继续。

raise-此方法将引发错误(ClusterError)并终止算法。

check_finite-布尔值,可选

此参数用于检查输入矩阵是否仅包含有限数字。禁用此参数可能会给您带来性能提升,但如果观察确实包含无穷大,它也可能导致一些问题,例如崩溃或非终止。此参数的默认值为True

退货

质心-ndarray

它通过N个质心数组返回ak。

标签-ndarray

这是质心的索引。