|
|
1
2
如果您不确定您的任务是否适合可用的内存,最好在分析后插入行到数据库表中,让数据库担心如何排序数据(timestamp列上的索引将有助于:-)
如果你确定记忆没有问题,我会用
确保FileEntry类实现
|
|
|
2
0
在每个文件中,您可以假定条目是按时间顺序排列的,因为“下一行”写在“上一行”之后。 这意味着您可能应该实现合并排序。最好将两个最小的文件合并排序,然后重复,直到有一个文件为止。 请注意,如果这些文件来自多台计算机,您仍然会使日志无序;因为,除非机器时钟通过某种可靠的方法进行同步,否则时钟将有所不同。即使它们是同步的,时钟也会有所不同;然而,它们之间的差异可能会小到不重要。 合并排序不是最快的排序,但是它有一些非常有益的副作用。也就是说,它可以对每一对文件并行实现,而且比不按顺序排序的排序快得多,它是内存消耗友好的,并且在两个文件合并结束时可以轻松地进行检查。这意味着您可以从中断的排序会话中恢复,而只会损失部分工作。 |
|
|
7BeholdeR7 · 文件夹的重量超过其中的文件(六倍) 3 年前 |
|
|
ilteris · 为什么程序在fscanf后崩溃 3 年前 |
|
Peaceful · 使用fscanf读取C中具有未知行数的文件 3 年前 |
|
|
NOCi · 如何将Tensorflow的结果记录到CSV文件 3 年前 |
|
|
Oakzeh · 如何在字符串索引之前读取文件并删除字符 3 年前 |