代码之家 › 专栏 › 技术社区 › Robert

熊猫系列。应用-使用其他系列的参数?

pandas python

Robert · 技术社区 · 6 年前

我有以下声明:

>>> df['result'] = df['value'].apply(myfunc, args=(x,y,z))

Python函数myfunc是在我开始使用Pandas之前编写的,它被设置为接受单个值。参数x和z是固定的,可以很容易地作为变量或文字传递,但是我的数据框中有一列表示y参数,因此我正在寻找一种方法来为每一行使用该行的值(它们在每一行中不同)。

我的解决方法如下:

values = list(df['value'])
y = list(df['y'])
df['result'] = pd.Series([myfunc(values[i],x,y[i],z) for i in range(0,len(values))])

有更好的办法吗?

编辑

使用functools.partial有一个能够解决的问题。如果您的调用不坚持关键字参数,则它似乎会诉诸于位置,然后您可能会遇到 'myfunc()为…获取了多个值'

我修改了coldspeed的答案:

# Function myfunc takes named arguments arg1, arg2, arg3 and arg4
#   The values for arg2 and arg4 don't change so I'll set them when
#   defining the partial (assume x and z have values set)
myfunc_p = partial(myfunc, arg2=x, arg4=z)
df['result'] = [myfunc_p(arg1=w, arg3=y) for w, y in zip(df['value'], df['y'])]

2 回复 | 直到 6 年前

cs95 abhishek58g 6 年前

我觉得你做的很好。我可能会做一些改进:

from functools import partial
myfunc_p = partial(myfunc, x=x, z=z)
df['result'] = [myfunc_p(v, y) for v, y in zip(df['value'], df['y'])]

你不需要用 pd.Series 调用,您可以通过修复两个参数来清除函数调用。 functools.partial .

np.vectorize (免责声明,这实际上并没有将函数矢量化,只是隐藏了循环)对于更简洁的代码,但是在大多数情况下,列表理解应该更快。

myfunc_v = np.vectorize(partial(myfunc, x=x, z=z))
df['result'] = myfunc_v(df['value'], df['y'])

rer 6 年前

你也可以 apply 用一个 lambda

df['result'] = df.apply(lambda row: myfunc(row['value'], y=row['y'], x=x, z=z), axis=1)

推荐文章

Mainland · Python数据帧规范化值错误:列的长度必须与键相同

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

rpn · 如何在列[1]中连续第二次出现“0”时返回列[0]的值

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前

Gtoth · 如何分割Pandas DataFrame中包含多个日期的两个时间戳之间的差异

1 年前

Domarius · 使用loc为多行设置多列值

1 年前

Swastik Bhattacharyya · 如何在同一类别类型的多列上运行get_dummies()函数?

1 年前

DrZoidberg09 · 如何在字典列表中创建一个新关键字,该关键字是另一个关键字的总和?

1 年前

armstrong3701 · 如何有效地处理熊猫数据框中缺失的数据并计算条件统计?

1 年前

msts1906 · 大熊猫向乳胶的适当多品种出口

1 年前