|
1
2
我想你有一个热编码你的数据。为了使用K-means聚类,重新缩放数据很重要,因为您可能有一些数字特征将主导聚类。您可以尝试从 here (最著名的是MinMaxScaler和StandardScaler)。 之后,您可以参考 here 了解如何将KMeans与sklearn结合使用。一般而言,步骤如下: 导入KMeans:
您实例化了一个KMeans对象,至少指定了集群的数量,这里我任意放置了8个:
然后用数据拟合对象(此处我的数据名为X):
之后,您可以使用
您还可以使用
|
![]() |
Walter U. · “特征重要性”的“一个热编码”变量的显示名称 7 年前 |
|
Raag Agrawal · H2o GLM仅与某些预测因子相互作用 7 年前 |
![]() |
DVL · 熊猫:如何在不寻常的文本顺序中分解 8 年前 |