代码之家 › 专栏 › 技术社区 › Jasper

pandas:。apply函数为整个列提供单个值[重复]

pandas python

Jasper · 技术社区 · 7 年前

这个问题已经有了答案:

How to compare one value with 'NaN' in if statement: Python 3.5.2 | Anaconda 4.1.0 (64 bit) For example: a!=Nan where a is either a float value 1个答案

假设我有以下数据帧:

ID  |  has_id_dummy
-----------------------
 340         NaN
 NaN         NaN
 NaN         NaN
 200         NaN

我想把它变成这个数据框架:

     ID  |  has_id_dummy
    -----------------------
     340         1
     NaN         0
     NaN         0
     200         1

为此,我提出了以下功能:

def dummypopulator(x):
    if x != np.nan:
        return 1
    return 0

我用下面的线路打电话

df['has_id_dummy'] = df['ID'].apply(dummypopulator)

但是所有行的值都被设置为1,甚至那些没有ID并且应该是0的行。

     ID  |  has_id_dummy
    -----------------------
     340         1
     NaN         1
     NaN         1
     200         1

我尝试使用单独的lambda调用函数,如我在示例中看到的:

df['has_id_dummy'] = df['ID'].apply(lambda x: dummypopulator(x))

但结果是一样的。

我觉得我错过了一个非常明显的错误,但对于我来说,我无法理解为什么它不能工作。有人知道我做错了什么吗?

2 回复 | 直到 7 年前

BENY 7 年前

def dummypopulator(x):
    if ~np.isnan(x):
        return 1
    else :
        return 0
df['ID'].apply(dummypopulator)
Out[256]: 
0    1
1    0
2    0
3    1
Name: ID, dtype: int64

原因:

np.nan!=np.nan
Out[257]: True

我提出这个问题的方法

df['ID'].notnull().astype(int)

DYZ 7 年前

价值 nan 是 不是数字 不能与其他数字相比。特别地, nan==nan 不是真的(也不是 nan!=nan )

在您的情况下,使用 apply 甚至没有必要。就这么做吧 df['has_id_dummy'] = df['ID'].notnull().astype(int) 。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

5 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

5 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

5 月前

user29715306 · from_users=和chats=电视节目中的差异

5 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

5 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

5 月前

prayner · 更新嵌套字典包含列表中的项

5 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

5 月前

Dave · 如何在for循环中修改列表值

5 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

5 月前