代码之家 › 专栏 › 技术社区 › Tanmay Bhatnagar

预测时如何使用主成分分析?

pca scikit-learn machine-learning python-3.x

Tanmay Bhatnagar · 技术社区 · 7 年前

假设我的原始数据集有8个特征,我应用 PCA n_components = 3 (我正在使用 sklearn.decomposition.PCA ). 然后,我使用这3个PCA组件(现在是我的新功能)训练我的模型。

而预测呢? 即使我只预测一个数据点,我也需要这样做吗?

让我困惑的是,当我进行预测时,每个数据点都是2D矩阵中的一行(由我想要预测的所有数据点组成)。所以如果我申请 主成分分析 仅在一个数据点上,相应的行向量将转换为零向量。

1 回复 | 直到 7 年前

Miriam Farber 7 年前

如果在主成分分析的前三个组件上拟合模型,则必须适当转换任何新数据。例如,考虑以下代码: here :

pca = PCA(n_components=n_components, svd_solver='randomized',
          whiten=True).fit(X_train)

X_train_pca = pca.transform(X_train)
X_test_pca = pca.transform(X_test)


clf = GridSearchCV(SVC(kernel='rbf', class_weight='balanced'), param_grid)
clf = clf.fit(X_train_pca, y_train)

y_pred = clf.predict(X_test_pca)

SVM )在转换后的数据上。

X_test 仅包含1个数据点,您仍然可以使用 PCA [1,2,0,5] X_test=[[1,2,0,5]] . 也就是说,它是一个具有1行的2D矩阵。

推荐文章

Bushra Jabeen · 计算列中的互信息

2 年前

rkraaijveld · sklearn的Coef。线性回归为无

3 年前

Sherwin R · 随机森林预测错误的输出形状

3 年前

Trinh Hieu · 我想在100%中随机训练60%,剩下的40%在混乱矩阵中测试

3 年前

Gijo george · 如何识别段落中每个句子的情绪

3 年前

Test · 安装Scikit Learn Big Sur M1

3 年前

kukelia · 在自定义转换器内创建新数据帧时,SKlearn管道无法工作

3 年前

Arnoldas Maslovskis · 当需要1d数组时,传递了列向量y。请将y的形状更改为(n_samples),例如使用ravel()

3 年前

Rich · 我可以简化零系数的Lasso Lars运行时吗?

3 年前

Medo · 是否可以将3D图像转换为一个矢量?

6 年前