代码之家 › 专栏 › 技术社区 › Makoto Miyazaki

Pandas:groupby并通过连接结果生成新列

concat merge pandas python

Makoto Miyazaki · 技术社区 · 7 年前

我有一个这样的数据框。

> df
tour_id  time  condA  condB  condC
      1    10   True   True   True
      1    20   True   True   True
      1    30  False  False  False
      1    40  False  False  False
      2    15   True   True   True
      2    25  False  False  False
      2    30  False  False  False
      2    45  False  False  False
      2    50   True   True   True

子句 tour_id 取一笔 time 列,其中 condA condB 和 condC 都是 False
```
tour_id    sum
      1     70
      2    100
```
将1的结果合并到原始数据帧 df ,在组中填充相同的值,并将此新列命名为 driving .

结果应该是:

tour_id  time  condA  condB  condC  driving
      1    10   True   True   True       70
      1    20   True   True   True       70
      1    30  False   False False       70
      1    40  False   False False       70
      2    15   True   True   True      100
      2    25  False  False  False      100
      2    30  False  False  False      100
      2    45  False  False  False      100
      2    50   True   True   True      100

我的尝试:

temp = df[(df.condA == True)&(df.condB == True) &(df.condC == True)]
df2 = temp.groupby('tour_id').time.sum().reset_index()

但我不知道怎么合并 df2 原汁原味 .

3 回复 | 直到 7 年前

rahlf23 7 年前

df['driving'] = df['tour_id'].map(df[~df[['condA','condB','condC']].all(1)].groupby('tour_id')['time'].sum())

产量:

   tour_id  time  condA  condB  condC  driving
0        1    10   True   True   True       70
1        1    20   True   True   True       70
2        1    30  False  False  False       70
3        1    40  False  False  False       70
4        2    15   True   True   True      100
5        2    25  False  False  False      100
6        2    30  False  False  False      100
7        2    45  False  False  False      100
8        2    50   True   True   True      100

BENY 7 年前

使用 all

df['driving']=df.tour_id.map(df[(df.iloc[:,-3:]).all(1)].groupby('tour_id').time.sum())

ysearka 7 年前

您可以将groupby数据帧转换为dict,然后通过它映射tour\u id列:

df['driving'] = df.tour_id.map(temp.groupby('tour_id').time.sum().to_dict())

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

7 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

7 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

7 月前

user29715306 · from_users=和chats=电视节目中的差异

7 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

7 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

7 月前

prayner · 更新嵌套字典包含列表中的项

7 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

7 月前

Dave · 如何在for循环中修改列表值

7 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

7 月前