代码之家 › 专栏 › 技术社区 › Christina

如果默认列中的行为NaN,如何从dataframe中的其他列中选择行?

nan numpy dataframe pandas python

Christina · 技术社区 · 4 年前

我的数据框由3列组成。第三列基于前两列。默认列是第2列。但如果第2列是NaN,那么我希望第3列用第1列填充。我在条件中添加了第三行,但它似乎不起作用。

这是数据帧:

df = pd.DataFrame(np.array([[np.nan, 1717], [1749, 1750], [1704, np.nan]]),
                   columns=['a', 'b'])

这是我的代码:

import numpy as np
import pandas as pd
conditions = [
    (df["b"] <= df["a"]), 
    df["b"] > df["a"],
    df["b"] == df["b"].isna()]

choices = [df["b"], df["a"], df["a"]]

df['c'] = np.select(conditions, choices, default=df["b"])
print(df)

这是我的输出:

           a            b      c
0        NaN         1749.0  1749.0
1        1717.0      1750.0  1717.0
2        1704.0      NaN     NaN

但如果a或b被填充,我希望c被填充。这就是我想要的输出:

           a            b      c
0        NaN         1749.0  1749.0
1        1717.0      1750.0  1717.0
2        1704.0      NaN     1704.0

3 回复 | 直到 4 年前

baileythegreen 4 年前

你只需要对你的第三个条件做一个小小的改变。 df["b"].isna() 已经回来了 True 或 False 所以 df["b"] == df["b"].isna() 实际上是在检查 df["b"] 结果是一样的 boolean (事实并非如此)。

只需删除第三个条件的前半部分。

import numpy as np
import pandas as pd
conditions = [
    (df["b"] <= df["a"]), 
    df["b"] > df["a"],
    df["b"].isna()]

choices = [df["b"], df["a"], df["a"]]

df['c'] = np.select(conditions, choices, default=df["b"])
print(df)

le_camerone 4 年前

这似乎有效:

df = pd.DataFrame(np.array([[np.nan, 1717], [1749, 1750], [1704, np.nan]]),
               columns=['a', 'b'])

df['c'] = df.a

for i in range(len(df)):
    if df.a.iloc[i] == np.nan:
        df.c.iloc[i] = df.b.iloc[i]

ML1 4 年前

此解决方案提供您想要的输出:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.array([[np.nan, 1717], [1749, 1750], [1704, np.nan]]),
                   columns=['a', 'b'])

def fill_row(row):
    if pd.isnull(row['a']): 
        return row['b']
    else: 
        return row['a']

df['c'] = df.apply(lambda row : fill_row(row), axis=1) 
print(df)

输出:

        a       b       c
0     NaN  1717.0  1717.0
1  1749.0  1750.0  1749.0
2  1704.0     NaN  1704.0

推荐文章

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

Cam · Pandas列表日期到日期时间

1 年前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

1 年前

Sun Jar · 在另一个系列中查找当前df值的索引,并将其添加到列中

1 年前

dietzi96 · Pandas DataFrame.to_sql随机和静默地失败,没有错误消息

1 年前

Bijan · Pandas批量更新帐户字符串

1 年前

Kernel · TypeError:Index.reindex()收到意外的关键字参数fill_value'

1 年前

Kernel · 进入熊猫的定义。系列super().reindex

1 年前

adventurous_chip_55 · 如何引爆柱子

1 年前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

1 年前