代码之家 › 专栏 › 技术社区 › William

熊猫如何根据不同的列和不同的条件删除行

dataframe pandas python-3.x python

William · 技术社区 · 4 年前

我有一个df,你可以通过复制以下代码获得:

from io import StringIO
df = """
      RateCompany   gs  RB  ValIssueDate
 115    T           G   54  19580101
 116    T           G   54  19870101
 336    T           S   54  19580101
 337    T           S   54  19870101
 338    T           j   53  19970101
"""
df = pd.read_csv(StringIO(df.strip()), sep='\s+')

输出应为:

 RateCompany    gs  RB  ValIssueDate
         115    T           G   54  19580101
         336    T           S   54  19580101
         338    T           j   53  19970101

有朋友能帮忙吗?

3 回复 | 直到 4 年前

not_speshal 4 年前

按要比较的列排序,然后在关键列上删除重复项:

df.sort_values('ValIssueDate').drop_duplicates(['RateCompany', 'gs', 'RB'])

输出:

    RateCompany gs  RB  ValIssueDate
115           T  G  54      19580101
336           T  S  54      19580101
338           T  j  53      19970101

rhug123 4 年前

这里有另一种使用 idxmin()

df.loc[df.groupby(['RateCompany', 'gs', 'RB'])['ValIssueDate'].idxmin()]


     RateCompany   gs   RB  ValIssueDate
115            T    G   54  19580101
336            T    S   54  19580101
338            T    j   53  19970101

not_speshal 4 年前

你可以用 groupby 具有 min

>>> df.groupby(["RateCompany", "gs", "RB"], as_index=False)["ValIssueDate"].min()

  RateCompany gs  RB  ValIssueDate
0           T  G  54      19580101
1           T  S  54      19580101
2           T  j  53      19970101

推荐文章

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

Cam · Pandas列表日期到日期时间

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

1 年前

LMC · Numpy数组布尔索引以获取包含元素

1 年前

vr8ce · 非成对标记中特定字符的正则表达式

1 年前

Kernel · 如果指定了crs参数,shapefile的geopandas.read_file将出错

1 年前

ShaAnder · 为什么sqllachemy返回的是类而不是字符串

1 年前

sixtytrees · detectron2软件包未安装(没有名为“torch”的模块),但我安装了torch

1 年前

Pernoctador · Python映射可以复制吗?我需要参考地图

1 年前