代码之家 › 专栏 › 技术社区 › Filipe Ferminiano

ValueError:多类因变量不支持未知

scikit-learn python

Filipe Ferminiano · 技术社区 · 8 年前

我试图在sklearn中拟合向量,但我收到了以下错误:

    X = df_features.values
    X = X.reshape((len(X),len(df_features.columns)))
    Y = df_train['action'].values
    Y = Y.reshape((len(Y),))

pipeline = Pipeline([
 ('clf', RandomForestClassifier())
])

parameters = {
    'clf__max_depth': [5,7,9],
    'clf__max_features': [3,4,5],
    'clf__min_samples_leaf': [3,4,5,6,7],
    'clf__bootstrap': [True]
}

score_func = make_scorer(metrics.f1_score,average='weighted')

grid_search = GridSearchCV(pipeline, parameters, n_jobs=3,
  verbose=1, scoring=score_func)

grid_search.fit(X, Y)

这是Y样本数据:

[“NOTHING”,“NOTHING”,“SELL”,“SELL”,“NOTHING”,

我怎样才能解决这个问题?
谢谢

1 回复 | 直到 8 年前

seralouk 8 年前

请检查x和y的类型和尺寸。此外,您是否有足够的样本用于所需的最大深度和最小样本叶?

from sklearn.pipeline import Pipeline
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import fbeta_score, make_scorer
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris 
import numpy as np
from sklearn import metrics
from sklearn.model_selection import LeaveOneOut


loo= LeaveOneOut()
data = load_iris()

x = data.data
x = x[0:14,:]
x.shape

y = ['NOTHING', 'NOTHING', 'SELL', 'SELL', 'NOTHING', 'NOTHING','SELL','SELL','NOTHING','SELL','SELL','NOTHING','NOTHING','NOTHING']
y = np.asarray(y)
y = y.reshape(14,1)
y = y.astype('str')


pipeline = Pipeline( [ ('clf', RandomForestClassifier() )] )

parameters = {'clf__max_depth': [1,2,3], 'clf__max_features': [1,2,3], 'clf__min_samples_leaf': [1,2,3], 'clf__bootstrap': [True] }

score_func = make_scorer(metrics.f1_score,average='weighted')

grid_search = GridSearchCV(pipeline, parameters, n_jobs=1 , verbose=1, scoring=score_func, cv = loo)

grid_search.fit(x, y)

后果

Fitting 14 folds for each of 45 candidates, totalling 630 fits
[Parallel(n_jobs=1)]: Done 630 out of 630 | elapsed:   33.7s finished

希望这有帮助

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

11 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

11 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

11 月前

user29715306 · from_users=和chats=电视节目中的差异

11 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

11 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

11 月前

prayner · 更新嵌套字典包含列表中的项

11 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

11 月前

Dave · 如何在for循环中修改列表值

11 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

11 月前