代码之家  ›  专栏  ›  技术社区  ›  Rob

随机访问多个文件和文件缓存

  •  -3
  • Rob  · 技术社区  · 15 年前

    这与一些我被赋予“修复”功能的软件有关。最简单和最快速的解决方案是打开和读取数百个随机文件中的10个,提取一些非常短的字符串进行处理,然后立即关闭它们。另一个过程可能就在这之后出现,对不同或相同的随机文件执行相同的操作,这可能在几秒钟内发生数百次。

    我知道现代操作系统将这些文件保存在内存中,这样磁盘抖动就不会像过去那样成为一个问题,但是我正在寻找关于如何确定打开/关闭许多随机文件何时会成为一个问题的任何文章或讨论。

    1 回复  |  直到 15 年前
        1
  •  1
  •   David Schmitt    15 年前

    当工作集(所有进程读取的数据量)超过可用RAM时,吞吐量将趋向于底层磁盘的I/O容量。

    从您对工作负载的描述来看,查找时间比数据传输率更为重要。

    当您的工作集大小保持在您拥有的RAM数量以下时,操作系统将保持所有数据缓存,并且在缓存填满后不需要转到磁盘。