代码之家  ›  专栏  ›  技术社区  ›  Georg Heiler

功能工具分类处理

  •  3
  • Georg Heiler  · 技术社区  · 7 年前

    Featuretools提供了处理分类变量的集成功能

    variable_types={"product_id": ft.variable_types.Categorical} https://docs.featuretools.com/loading_data/using_entitysets.html
    

    但是这些应该是 strings pandas.Category 与Featuretools实现最佳兼容性的类型?

    编辑

    另外,是否需要像中那样手动指定所有列 https://github.com/Featuretools/predict-appointment-noshow/blob/master/Tutorial.ipynb

    import featuretools.variable_types as vtypes
    variable_types = {'gender': vtypes.Categorical,
                      'patient_id': vtypes.Categorical,
                      'age': vtypes.Ordinal,
                      'scholarship': vtypes.Boolean,
                      'hypertension': vtypes.Boolean,
                      'diabetes': vtypes.Boolean,
                      'alcoholism': vtypes.Boolean,
                      'handicap': vtypes.Boolean,
                      'no_show': vtypes.Boolean,
                      'sms_received': vtypes.Boolean}
    
    1 回复  |  直到 7 年前
        1
  •  3
  •   Max Kanter    7 年前

    在将数据加载到Featuretools中时,应使用数据类型。与使用字符串相比,这将显著节省内存使用量。

    推荐文章