代码之家 › 专栏 › 技术社区 › Hrvoje

熊猫的lambda函数条件不能识别np.nan。

dataframe numpy pandas python-3.x

Hrvoje · 技术社区 · 6 年前

在pandas数据帧上,我有一个函数,它将替换列中的以下内容 mileage :

for index,row in carsDF6.iterrows():
    if carsDF6.loc[index,'mileage'] > 600000:
        carsDF6.loc[index,'mileage'] = np.nan
    if carsDF6.loc[index,'mileage'] < 4000:
        carsDF6.loc[index,'mileage'] = np.nan

没问题。在那之后,我想用整列的平均数代替那些np.nan's 里程 我在用:

carsDF6.mileage= carsDF6.mileage.map(lambda x: carsDF6.mileage.mean() if x == np.nan else x)

它没有抛出任何错误,只是没有做它想做的,因为当我检查Nan的时:

carsDF6.loc[carsDF6.isnull().any(axis=1)]

它仍然与南的6张唱片一样。

1 回复 | 直到 6 年前

sacuL 6 年前

最容易使用 fillna 平均值:

carsDF6['mileage'] = carsDF6.mileage.fillna(carsDF6.mileage.mean())

但是如果你想修正你的方法,你可以检查等式。 NaN 带着 np.isnan :

carsDF6['mileage'] = carsDF6.mileage.map(lambda x: carsDF6.mileage.mean() if np.isnan(x)  else x)

推荐文章

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

4 月前

Cam · Pandas列表日期到日期时间

4 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

4 月前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

5 月前

LMC · Numpy数组布尔索引以获取包含元素

5 月前

vr8ce · 非成对标记中特定字符的正则表达式

6 月前

Kernel · 如果指定了crs参数,shapefile的geopandas.read_file将出错

6 月前

ShaAnder · 为什么sqllachemy返回的是类而不是字符串

6 月前

sixtytrees · detectron2软件包未安装(没有名为“torch”的模块),但我安装了torch

6 月前

Pernoctador · Python映射可以复制吗?我需要参考地图

6 月前