代码之家 › 专栏 › 技术社区 › npross

转换熊猫系列以进行整数比较的简单方法

multiple-columns where indexing pandas python

npross · 技术社区 · 8 年前

我有非常简单的。下面的代码,并希望选择所有具有最高的1_排名的团队。

import pandas as pd
table = pd.read_table('team_rankings.dat')
table.head()

rank    team    rating  highest_rank    highest_rating  
0   1   Germany 2097    1   2205    
1   2   Brazil  2086    1   2161    
2   3   Spain   2011    1   2147    
3   4   Portugal    1968    2   1991    
4   5   Argentina   1967    1   2128

type((table['highest_rank'])) 
pandas.core.series.Series

table.loc[(table['highest_rank']) < 2]

然后给我一个

TypeError: unorderable types: str() < int()

2 回复 | 直到 8 年前

Bharath M Shetty 8 年前

使用者 pd.to_numeric 具有 errors ='coerce' 即

df.loc[(pd.to_numeric(df['highest_rank'],errors='coerce')) < 2]

输出:

  rank       team  rating  highest_rank  highest_rating
0     1    Germany    2097             1            2205
1     2     Brazil    2086             1            2161
2     3      Spain    2011             1            2147
4     5  Argentina    1967             1            2128

mkastner 8 年前

可以将“-”解析为NaN值。这可能会帮助你完成更多的未来任务。

table = pd.read_table('team_rankings.dat', na_values="-")

看见 https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

推荐文章

Merlin Nestler · 为什么索引中的列顺序在这种情况下会产生如此大的影响?

1 年前

Max · 用两列中的特定值对识别R中的数据帧行

1 年前

Remaker Shadow · Excel-索引+匹配公式问题[重复]

1 年前

Dasi · Pandas.loc返回序列或浮点数不一致

1 年前

climsaver · 首次连续查找两个相同值的索引

1 年前

Ecanyte · 矩阵索引/展平

1 年前

Some Name · 为什么index[]试图移动值,但直接调用index不会[重复]

1 年前

sds Niraj Rajbhandari · 在时间戳索引中按日期时间查找不起作用

1 年前

babipsylon · 在C中创建div_t类型结构元素的数组++

1 年前

Martin AJ · 如何在庞大的数据集上快速执行COUNT(*)?

1 年前