代码之家  ›  专栏  ›  技术社区  ›  lapots

将数据框架列标题和值拆分为多个列

  •  0
  • lapots  · 技术社区  · 6 年前

    我上传了我的 csv 在Azure上的文件,但出于某种原因,它变成了这样

     nominal;data;curs;cdx         Column 1
    0          1;21.06.2000;28  2300;������ ���
    1          1;22.06.2000;28  2200;������ ���
    2          1;23.06.2000;28  1900;������ ���
    3          1;24.06.2000;28  1700;������ ���
    4          1;27.06.2000;28  1300;������ ���
    5          1;28.06.2000;28  1100;������ ���
    

    基本上不是四列 nominal , data , curs , cdx 我有两列,其中一列包含所有值,最后一列(它是空的,或者因为最后一列有编码问题)不知道是什么。

    我删除了专栏 Column 1 这样地

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1.drop(['Column 1'], axis = 1, inplace = True)
        print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
        return dataframe1,
    

    如何将第一列拆分为多个?获取4个单独的列

    我用的是熊猫0.18

    1 回复  |  直到 6 年前
        1
  •  1
  •   xyzjayne    6 年前

    您需要将列拆分为:

    dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)
    

    然后将标题更改为:

    dataframe1.columns = 'nominal;data;curs;cdx'.split(';')