代码之家 › 专栏 › 技术社区 › Ahmad.Masood

执行standardscaler后将nan分配给-1

scikit-learn dataframe pandas python

Ahmad.Masood · 技术社区 · 7 年前

我想 标准定标器 (通过sk learn)某些数据帧,其中包含许多南值,并在执行此scaler移位之后,我要分配所有 NaN 到1。我们知道standardscaler不能处理nan值,这怎么可能呢?

如果有其他解决方案(不依赖于 科学软件学习 )也请提及这一点。

df = pd.DataFrame(StandardScaler().fit_transform(values_to_scale.values))

我收到以下错误消息:

ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

1 回复 | 直到 7 年前

Gambit1614 7 年前

处理nan值并不是那么简单。在进一步处理nan值之前,需要对数据进行分析。有多种方法可以处理这些丢失的值(以下不是详尽的列表):

忽略其他缺少的值 :此方法的问题是,缺少的行可能在其他列中包含重要信息,忽略它们将导致不完整的分析
用另一个值替换它们 :这是常用的方法之一,但是选择要替换的值将影响您的总体分析。您可以用say mean替换它们,或者说一个占位符值(比如-1),您知道这个值在整个列中都不会出现。
使用回归替换值
**使用knn替换值**

你可以看一下下面的链接,得到一个更好的主意

另外,你可以看看 official sklearn documentation for imputing missing values .

更新 :执行标准标量时,可以忽略NaN值,如下所示

import numpy as np    
import pandas as pd
from sklearn.preprocessing import StandardScaler

#Create a dataframe
df = pd.DataFrame({'col1': [0, np.nan, 2, 3, np.nan, 4, 5, np.nan, 6, 7, np.nan]})

#Get the index of null values
null_values = d['col1'].isnull()

#Perform standard scalar on only non-NaN values
df.loc[~null_values, ['col1']] = StandardScaler().fit_transform(df.loc[~null_values, ['col1']])

产量

    col1
0   -1.728498
1   NaN
2   -0.832240
3   -0.384111
4   NaN
5   0.064018
6   0.512148
7   NaN
8   0.960277
9   1.408406
10  NaN

然后使用 df.fillna

df.fillna(-1)

出局

    col1
0   -1.728498
1   -1.000000
2   -0.832240
3   -0.384111
4   -1.000000
5   0.064018
6   0.512148
7   -1.000000
8   0.960277
9   1.408406
10  -1.000000

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

1 年前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

user29715306 · from_users=和chats=电视节目中的差异

1 年前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

prayner · 更新嵌套字典包含列表中的项

1 年前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前