代码之家 › 专栏 › 技术社区 › Pete

在.NET中是否加载了文件流延迟?

performance .net

Pete · 技术社区 · 17 年前

我有一个关于在.NET中使用流从磁盘加载文件的问题。我试图找出一个性能问题,并确定它在我认为的地方。

Dim provider1 As New MD5CryptoServiceProvider
Dim stream1 As FileStream

stream1 = New FileStream(FileName, FileMode.Open, FileAccess.Read, FileShare.Read)
provider1.ComputeHash(stream1)

问:当我创建文件流对象时,或者当使用流的对象(在本例中是MD5哈希算法)实际读取该对象时,是否从磁盘读取字节?

当使用 ComputeHash 方法,与本地测试环境进行比较。我只是想确保性能问题在散列中,而不是在磁盘访问中。

3 回复 | 直到 17 年前

Chris Wenham 17 年前

文件流只是在文件对象周围公开一个IO.stream,并使用缓冲区。它不会读取构造函数中的整个文件(该文件可能大于RAM)。

性能问题最有可能出现在散列中,您可以执行一些简单的基准测试来证明它是由于文件IO还是算法本身。

但你可能会尝试的第一件事是:

provider1.ComputeHash(stream1.ToArray());

这将使文件流读取整个文件并返回一个字节数组。.ToArray()调用的方法可能比ComputeHash将调用的.read()方法更快。

MichaelT 17 年前

是的,将读取该文件的内容,然后运行computehash方法,而不是在刚打开文件流时。

测试性能问题所在的最佳方法是将数据从文件读取到内存流散列并测量每个步骤的性能。您可以为此使用System.Diagnostics.StopWatch类。

Dario Solera 17 年前

当调用者通过调用read或类似方法请求从磁盘读取字节时,应该读取这些字节。无论如何,硬盘和操作系统都会执行一些预读操作来改进顺序读取操作,但这肯定很难预测。

您还可以尝试使用一些构造函数重载为filestream提供的缓冲区大小参数。

推荐文章

Sweepy Dodo · JSON lite的格式化

8 月前

Merlin Nestler · 为什么索引中的列顺序在这种情况下会产生如此大的影响?

8 月前

giantjenga · 优化整数向量到二进制向量的转换

9 月前

Adriaantje · Powershell版本的cut-d在处理大文件时速度很慢,我是否错过了快速的方法?

9 月前

Costinean Sebastian · 如何优化使用for循环处理大型数组的MATLAB脚本的执行时间?"

9 月前

Zegarek · Postgresql递归查询未提供预期结果

9 月前

Joe · 为什么这两个查询之间的性能存在如此大的差异?

1 年前

tic-toc-choc · 在`dplyr中高效使用列表进行过滤`

1 年前

Mohan · 是否有一种更快的方法来编写代码,从1:N中提取许多随机样本?

1 年前

user2980746 · 在C#字典中键入xyz对的最有效方法是什么?

1 年前