代码之家 › 专栏 › 技术社区 › zipline86

熊猫读取\u csv并将na\u值设置为csv文件[duplicate]中的任何字符串

data-cleaning dataframe pandas python

zipline86 · 技术社区 · 7 年前

数据.csv

1, 22, 3432

2, 24, 54335

2, 25, 3928

我有一个从设备收集的csv文件。设备不时不时地传递信息并输出'\N'。我想把这些当成NaN来做

read_csv(data.csv, na_values=['\\N'])

效果不错。但是,我更希望不仅将这个字符串转换为NaN,而且将csv文件中的任何字符串都转换为NaN,以防将来得到的数据有不同的字符串。

我是否可以对参数进行任何更改,使其覆盖所有字符串?

1 回复 | 直到 5 年前

Abhi 7 年前

您必须手动将所有关键字作为列表或dict传递给 na_values

nau值:list like或dict,默认为None

pd.to_numeric 并将错误设置为 coerce 读取csv文件后将所有值转换为数字。

样本输入 df :

    A   B        
0   1   2         
1   0  \N      
2  \N   8       
3  11   5       
4  11  Kud   

df = df.apply(pd.to_numeric, errors='coerce')

输出:

     A     B        
0    1     2         
1    0   NaN      
2  NaN     8       
3   11     5       
4   11   NaN

推荐文章

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

11 月前

Daniel Estévez · 扩展数据帧以包含不存在的值

11 月前

T Richard · 根据条件交换分组数据中的字符串或值

11 月前

Homer Jay Simpson · R中flextable的标题字体和垂直合并

1 年前

RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值

1 年前

Ssong · 如何有条件地运用资本化?

1 年前

Marcio Lino · 在Pandas中转换多个值列

1 年前

Ray · 在Python pandas包中使用groupby函数时,输出结果存在差异的原因是什么?

1 年前

RobertF · 如果列没有表头,如何在R数据帧中引用变量名?

1 年前

Homer Jay Simpson · ggplot2`geom_label()中的警告消息`

1 年前