代码之家 › 专栏 › 技术社区 › Light_B jezrael

尝试使用dask读取xarray时文件过多

python-xarray dask python

Light_B jezrael · 技术社区 · 7 年前

我正在努力学习dask,以便能够对一个18年的NetCDF数据集进行一些计算,这个数据集每年有1464个文件,每个文件的大小都是1MB。我可以在一个循环中完成,但是我想用xarray测试dask的内置函数,看看它是否比传统的气候数据操作符更快、内存效率更高。所以,我只是通过加载一年的文件来测试它,它给了我“太多的文件错误”

big_ds = xr.open_mfdataset('path_to_folder/*')

我已经修改了打开文件的限制。

 ulimit -a
 >>core file size          (blocks, -c) 0
   data seg size           (kbytes, -d) unlimited
   scheduling priority             (-e) 0
   file size               (blocks, -f) unlimited
   pending signals                 (-i) 62527
   max locked memory       (kbytes, -l) 16384
   max memory size         (kbytes, -m) unlimited
   open files                      (-n) 8000
   pipe size            (512 bytes, -p) 8
   POSIX message queues     (bytes, -q) 819200
   real-time priority              (-r) 0
   stack size              (kbytes, -s) 8192
   cpu time               (seconds, -t) unlimited
   max user processes              (-u) 62527
   virtual memory          (kbytes, -v) unlimited
   file locks                      (-x) unlimited

0 回复 | 直到 7 年前

推荐文章

Ryan A. · Xarray-值错误:无法识别的块管理器dask-必须是以下之一:[]

2 年前

ClimateUnboxed · 添加到xarray数据集时,如何使用字符串变量定义dataarray名称?复制

2 年前

cabbage dude · 如何绘制hestia数据

2 年前

Mincheol · Python xarray,numpy,matplotlib netcdf屏蔽海洋?

2 年前

zazoupile · 如何将grid对象写入到grid文件?

2 年前

Bobby Heyer · 尝试使用xarray组合文件时出现EntryPoints属性错误

3 年前

Jannes · 将具有单元维度(+lon/lat坐标)的数组转换为基于网格的数组(lon/lat维度)

3 年前

Shawn · 如何使用xr。使用更改的尺寸应用\u ufunc

8 年前

Exp HP · 为什么分配'xr。对数据集变量更改不相关的坐标?

8 年前

Light_B jezrael · 类似于xarray的Netcdf时间切片方法

8 年前