代码之家  ›  专栏  ›  技术社区  ›  Rolando

如何正确地拼接熊猫数据帧中的条目?

  •  0
  • Rolando  · 技术社区  · 6 年前

    我有一个熊猫csv,假设我的数据框是我的数据框。

    我的数据是注册数据,其中我有一个csv用于:

    Name, RegistrationID, DateSignedUp, Course
    

    我想通过删除注册少于5次的任何“姓名”行来“清理”数据框中的数据。

    我可以使用以下方法获取每个名称的注册计数:

    mydataframe.groupby('Name')['RegistrationID'].count()
    

    如何创建一个包含“name”注册超过5个的所有行的新数据框?

    1 回复  |  直到 6 年前
        1
  •  1
  •   BENY    6 年前

    你可以试试 transform

    n=5
    mydataframe=mydataframe[mydataframe.groupby('Name')['RegistrationID'].transform('count')>n].copy()