代码之家 › 专栏 › 技术社区 › Arjun

如何在数据集的特定列中提取元素?

neural-network numpy python

Arjun · 技术社区 · 6 年前

这里是我用来划分数据的代码:

data=np.genfromtxt("/home/crpsm/Pycharm/DataSet/headbrain.csv",delimiter=',')


x=data[:,:1]
y=data[:, :2]

这是x和y的输出:

[[3738.]
[4261.]
[3777.]
[4177.]
[3585.]
[3785.]
[3559.]
[3613.]
[3982.]
[3443.]

[[3738. 1297.]
[4261. 1335.]
[3777. 1282.]
[4177. 1590.]
[3585. 1300.]
[3785. 1400.]
[3559. 1255.]
[3613. 1355.]
[3982. 1375.]
[3443. 1340.]

请告诉我如何修复此错误。提前谢谢。。!!!

2 回复 | 直到 6 年前

Graipher 6 年前

什么 @w-m heir answer 是正确的,您当前正在分配所有行(第一行) : )所有列,从0开始到列1,不包括上限,到 x (与 :1 )所有行(还是第一行) : y (与 :2 ).

x = data[:, 0]
y = data[:, 1]

是正确实现这一点的一种方法,但更好、更简洁的方法是使用元组解包:

x, y = data.T

这就使(`T)数据互换,即交换两个维度,然后第一个维度的长度为2。如果实际数据的列数大于此数,则可以使用:

x, y, *rest = data.T

w-m 6 年前

使第二列的形状与 x ,使用 y=data[:, 1:2] .

注意:您正在使用此索引创建二维数组(形状为(len(data),1))。如果需要1d数组,只需对第二项使用整数,而不是切片:

x = data[:, 0]
y = data[:, 1]

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

5 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

5 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

5 月前

user29715306 · from_users=和chats=电视节目中的差异

5 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

5 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

5 月前

prayner · 更新嵌套字典包含列表中的项

5 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

5 月前

Dave · 如何在for循环中修改列表值

5 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

5 月前