代码之家 › 专栏 › 技术社区 › Cleb

为什么max()有时返回nan,有时忽略它?

missing-data replace pandas python

Cleb · 技术社区 · 8 年前

这个问题的动机是 an answer 我刚才给了。

假设我有一个这样的数据框

import numpy as np
import pandas as pd

df = pd.DataFrame({'a': [1, 2, np.nan], 'b': [3, np.nan, 10], 'c':[np.nan, 5, 34]})

     a     b     c
0  1.0   3.0   NaN
1  2.0   NaN   5.0
2  NaN  10.0  34.0

我想替换 NaN 按行的最大值, I can do

df.apply(lambda row: row.fillna(row.max()), axis=1)

这给了我想要的输出

      a     b     c
0   1.0   3.0   3.0
1   2.0   5.0   5.0
2  34.0  10.0  34.0

然而,当我使用

df.apply(lambda row: row.fillna(max(row)), axis=1)

出于某种原因,仅在以下三种情况中的两种情况下才能正确更换:

     a     b     c
0  1.0   3.0   3.0
1  2.0   5.0   5.0
2  NaN  10.0  34.0

确实,如果我亲自检查

max(df.iloc[0, :])
max(df.iloc[1, :])
max(df.iloc[2, :])

然后打印出来

3.0
5.0
nan

执行时

df.iloc[0, :].max()
df.iloc[1, :].max()
df.iloc[2, :].max()

它打印预期的

3.0
5.0
34.0

我的问题是为什么 max() 三种情况中的一种失败,但并非所有三种情况都失败。为什么 南安 有时被忽视,有时不被忽视?

4 回复 | 直到 8 年前

推荐文章

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

1 年前

Andrew Cheong · 如何在半异步情况下使用Javascript async/await?(例如,在String.replace中)[重复]

1 年前

Alex Howard · 如何用秒开始的值填充数据帧?

1 年前

user1946932 · 正则表达式:删除连续两个以上的<br>?

1 年前

leiseg · 阻止PowerShell Replace在替换字符串中添加新行[重复]

1 年前

Neeraj · 用R中的另一组单词替换该组单词

1 年前

Josephine Fang · pandas列部分子字符串替换为另一个数据帧列(如果子字符串包含字符串)

2 年前

Three Year Old · 如何仅在捕获组不为空的情况下插入特定字符?复制

2 年前

Makstvell · linux bash->sed(正则表达式)。如何用“source_dir”和“target_dir”替换所有出现的已定义节,以替换source_dir节中的内容

2 年前

Prabhu · 在文件中查找具有匹配字符串的数字,并使用ansible替换为另一个数字

2 年前