代码之家 › 专栏 › 技术社区 › ASH

我可以自定义类别代码吗?

pandas python-3.x python

ASH · 技术社区 · 5 年前

我在玩弄一些分类数据,叫做“评级”。我的数据如下(在数据框中):

AAA
AA
A
A+
BBB
BB
B
B+

我有大约25个类别。现在,我试图得到一个与这个评级字段相关的对应字段。我想看看这个:

... 最后减到1。到目前为止,我已经测试了这段代码。

modDF['Rating'] = modDF['Rating'].astype('category')
modDF['RatingCode'] = modDF['Rating'].cat.codes

这给了我类别,但不是根据我想要使用的逻辑。它看起来几乎像是在工作,但顺序相反,但是带有“+”字符的收视率看起来很奇怪。是否有某种方法可以根据某种vlookup或类似的东西来分配类别代码?谢谢

0 回复 | 直到 5 年前

RubenB 5 年前

如果您知道评级将遵循某种模式(即XXX、XX、XX、X+),您可以执行以下操作:

import pandas as pd
import itertools
import string

# df with dummy data
df = pd.DataFrame(['AAA', 'AA', 'A', 'A+', 'BBB', 'BB', 'B', 'B+'], columns=['Ratings'])

# collect ratings and assign a decreasing value to them
ratings = [[letter*3, letter*2, letter, letter+'+'] for letter in string.ascii_uppercase]  # create all possible ratings in order
ratings = list(itertools.chain.from_iterable(ratings))  # flatten list
ratings_code = dict(zip(ratings, reversed(range(len(ratings)))))

# map rating code to original rating
df['RatingCode'] = df.Ratings.map(ratings_code)

取决于您对产品范围的期望 RatingCode ,你需要调整 reversed(range(len(ratings)))

推荐文章

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

9 月前

Cam · Pandas列表日期到日期时间

9 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

9 月前

jjkennedy · Pandas文本文件导入:当每个文件中存在多个表时,自动选择1个表

10 月前

LMC · Numpy数组布尔索引以获取包含元素

10 月前

vr8ce · 非成对标记中特定字符的正则表达式

11 月前

Kernel · 如果指定了crs参数,shapefile的geopandas.read_file将出错

11 月前

ShaAnder · 为什么sqllachemy返回的是类而不是字符串

11 月前

sixtytrees · detectron2软件包未安装(没有名为“torch”的模块),但我安装了torch

11 月前

Pernoctador · Python映射可以复制吗?我需要参考地图

11 月前