使用Pipeline sklearn(Python)的多个自定义类
|
我尝试为学生做一个关于Pipeline的教程,但我阻止了.我不是专家,但我正在努力改进.谢谢你的放纵.
>步骤1:数据帧的描述 这是我的代码: class Descr_df(object):
def transform (self,X):
print ("Structure of the data: n {}".format(X.head(5)))
print ("Features names: n {}".format(X.columns))
print ("Target: n {}".format(X.columns[0]))
print ("Shape of the data: n {}".format(X.shape))
def fit(self,X,y=None):
return self
class Fillna(object):
def transform(self,X):
non_numerics_columns = X.columns.difference(X._get_numeric_data().columns)
for column in X.columns:
if column in non_numerics_columns:
X[column] = X[column].fillna(df[column].value_counts().idxmax())
else:
X[column] = X[column].fillna(X[column].mean())
return X
def fit(self,y=None):
return self
class Categorical_to_numerical(object):
def transform(self,X):
non_numerics_columns = X.columns.difference(X._get_numeric_data().columns)
le = LabelEncoder()
for column in non_numerics_columns:
X[column] = X[column].fillna(X[column].value_counts().idxmax())
le.fit(X[column])
X[column] = le.transform(X[column]).astype(int)
return X
def fit(self,y=None):
return self
如果我执行步骤1和2或步骤1和3它可以工作但是如果我同时执行步骤1,2和3.我有这个错误: pipeline = Pipeline([('df_intropesction',Descr_df()),('fillna',Fillna()),('Categorical_to_numerical',Categorical_to_numerical())])
pipeline.fit(X,y)
AttributeError: 'NoneType' object has no attribute 'columns'
出现这个错误是因为在Pipeline中第一个估算器的输出转到第二个估算器,然后第二个估算器的输出转到第三个,依此类推……
从documentation of Pipeline:
因此,对于您的管道,执行步骤如下: > Descr_df.fit(X) – >没有做任何事情并且回归自我 解决方案:更改Descr_df的transform方法以返回数据帧: def transform (self,X):
print ("Structure of the data: n {}".format(X.head(5)))
print ("Features names: n {}".format(X.columns))
print ("Target: n {}".format(X.columns[0]))
print ("Shape of the data: n {}".format(X.shape))
return X
建议:使您的类继承自scikit中的Base Estimator和Transformer类,以确认良好实践. 即将类Descr_df(对象)更改为类Descr_df(BaseEstimator,TransformerMixin),将Fillna(对象)更改为Fillna(BaseEstimator,TransformerMixin)等. 有关Pipeline中自定义类的更多详细信息,请参阅此示例: > http://scikit-learn.org/stable/auto_examples/hetero_feature_union.html#sphx-glr-auto-examples-hetero-feature-union-py (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
