代码之家  ›  专栏  ›  技术社区  ›  Light_B jezrael

尝试使用dask读取xarray时文件过多

  •  0
  • Light_B jezrael  · 技术社区  · 7 年前

    我正在努力学习dask,以便能够对一个18年的NetCDF数据集进行一些计算,这个数据集每年有1464个文件,每个文件的大小都是1MB。我可以在一个循环中完成,但是我想用xarray测试dask的内置函数,看看它是否比传统的气候数据操作符更快、内存效率更高。所以,我只是通过加载一年的文件来测试它,它给了我“太多的文件错误”

    big_ds = xr.open_mfdataset('path_to_folder/*')
    

    我已经修改了打开文件的限制。

     ulimit -a
     >>core file size          (blocks, -c) 0
       data seg size           (kbytes, -d) unlimited
       scheduling priority             (-e) 0
       file size               (blocks, -f) unlimited
       pending signals                 (-i) 62527
       max locked memory       (kbytes, -l) 16384
       max memory size         (kbytes, -m) unlimited
       open files                      (-n) 8000
       pipe size            (512 bytes, -p) 8
       POSIX message queues     (bytes, -q) 819200
       real-time priority              (-r) 0
       stack size              (kbytes, -s) 8192
       cpu time               (seconds, -t) unlimited
       max user processes              (-u) 62527
       virtual memory          (kbytes, -v) unlimited
       file locks                      (-x) unlimited
    
    0 回复  |  直到 7 年前