代码之家 › 专栏 › 技术社区 › Suman Chowdhury

Python:如何从一个数据帧中行查找数据,并基于列匹配在另一个数据帧中乘法

lookup dataframe numpy pandas python

Suman Chowdhury · 技术社区 · 8 年前

我有一个数据帧df1,它具有以下结构

A   B   C   D
10  9   9   4
5   4   4   9
5   10  6   4
9   9   9   4
4   7   10  7
9   7   4   8
5   7   8   9
10  4   10  6

我有另一个数据帧df2,如下所示,

name    factor
A   2
B   3
C   4
D   8

如何从df2中查找A,B,C,D的值,并与df1相乘[A,B,C,D],得到df3,例如,

A   B   C   D
20  27  36  32
10  12  16  72
10  30  24  32
18  27  36  32
8   21  40  56
18  21  16  64
10  21  32  72
20  12  40  48

1 回复 | 直到 8 年前

jezrael 8 年前

使用 mul 对于多个by Series 创建人 set_index :

df3 = df1.mul(df2.set_index('name')['factor'])
print (df3)
    A   B   C   D
0  20  27  36  32
1  10  12  16  72
2  10  30  24  32
3  18  27  36  32
4   8  21  40  56
5  18  21  16  64
6  10  21  32  72
7  20  12  40  48

详细信息:

print (df2.set_index('name')['factor'])
name
A    2
B    3
C    4
D    8
Name: factor, dtype: int64

编辑:

如果缺少某些类别,则可能使用 fillna 谢谢 Wen :

s = df2.set_index('name').drop('D')['factor']
print (s)
name
A    2
B    3
C    4
Name: factor, dtype: int64

df3 = df1.mul(s).fillna(df1)
print (df3)
      A     B     C    D
0  20.0  27.0  36.0  4.0
1  10.0  12.0  16.0  9.0
2  10.0  30.0  24.0  4.0
3  18.0  27.0  36.0  4.0
4   8.0  21.0  40.0  7.0
5  18.0  21.0  16.0  8.0
6  10.0  21.0  32.0  9.0
7  20.0  12.0  40.0  6.0

编辑1:

如果需要比较 DataFrame 通过 系列 :

s = df2.set_index('name')['factor']
print (s)
name
A    2
B    3
C    4
D    8
Name: factor, dtype: int64

df1['A'] = (np.log(df1['A']) * s['A']) ** 3
print (df1)
           A   B   C  D
0  97.664572   9   9  4
1  33.351293   4   4  9
2  33.351293  10   6  4
3  84.862013   9   9  4
4  21.313578   7  10  7
5  84.862013   7   4  8
6  33.351293   7   8  9
7  97.664572   4  10  6

对于所有列:

df1 = (np.log(df1) * s) ** 3
print (df1)
           A           B           C            D
0  97.664572  286.409295  678.896108  1364.068975
1  33.351293   71.933325  170.508622  5431.168861
2  33.351293  329.617932  368.145163  1364.068975
3  84.862013  286.409295  678.896108  1364.068975
4  21.313578  198.944581  781.316579  3772.578718
5  84.862013  198.944581  170.508622  4603.732789
6  33.351293  198.944581  575.466599  5431.168861
7  97.664572   71.933325  781.316579  2945.161306

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

1 年前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

user29715306 · from_users=和chats=电视节目中的差异

1 年前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

prayner · 更新嵌套字典包含列表中的项

1 年前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前