![]() |
1
3
查看光栅软件包。光栅包为Rgdal提供了一个方便的包装器,而无需将其加载到内存中。 http://raster.r-forge.r-project.org/ 希望能帮上忙。
通过使用光栅软件包,可以避免在使用randomForest之前填满内存。 [编辑]要解决random forest的内存问题,如果您可以在子样本(大小为<<n)而不是引导样本(大小为n)上学习randomForest中的各个树,可能会有所帮助。 |
![]() |
2
0
我认为这里的关键是:“一个包含每个像素值的数据帧,它在训练数据通道中不为零”。如果生成的data.frame小到可以保存在内存中,则可以通过仅读取该条带,然后仅修剪到那些非零值,然后尝试创建一个包含所需行数和列总数的data.frame。 你能管理这个吗?
然后,您可以通过分别读取每个波段并修剪训练波段来逐个填充data.frame的列。 如果data.frame太大,那么您就卡住了-我不知道randomForest是否可以使用“ff”中的内存映射数据对象,但这可能值得尝试。 编辑:一些示例代码,请注意,光栅为您提供内存映射访问,但问题是randomForest是否可以使用内存映射数据结构。您可能只能读入所需的数据,一次只能读入一个波段—您可能希望首先构建完整的data.frame,而不是附加列。 另外,如果您可以从一开始就生成完整的data.frame,那么您将知道它是否应该工作。通过rbind()作为代码遍历,您需要越来越大的连续内存块,这可能是可以避免的。 |
![]() |
Hard_Course · 用另一列中的值替换行的最后一个非NA条目 5 月前 |
![]() |
Mark R · 使用geom_sf()删除地球仪上不需要的网格线 5 月前 |
![]() |
Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期 5 月前 |
![]() |
Ben · 统计向量中的单词在字符串中出现的频率 5 月前 |
![]() |
TheCodeNovice · R中符号格式的尾随零和其他问题[重复] 5 月前 |
![]() |
dez93_2000 · 在R管道子功能中引用管道对象的当前状态 5 月前 |
![]() |
Mankka · 如何在Ggplot2中绘制均匀的径向图 6 月前 |