代码之家  ›  专栏  ›  技术社区  ›  Davi Resio

在字符串或stringbuilder中放入非常大的内容[duplicate]

  •  -3
  • Davi Resio  · 技术社区  · 7 年前

    我想获取一个非常大的html页面,但是当我尝试使用jsoup解析页面时,它报告了很多错误,因为页面太大了。

    我怎么能处理这么大的绳子?

    2 回复  |  直到 7 年前
        1
  •  2
  •   banncee    7 年前

    下载文件并保存到本地。然后使用缓冲文件读取器逐行读取文件并对其进行处理。考虑到文件的大小,将整个文件读入一个字符串似乎是个坏主意,而且您仍然无法有效地分析数据。

        2
  •  1
  •   Andreas dfa    7 年前

    答案是 text/plain

    执行一个简单的httpget,并在下载数据时解析数据,一次一行,以最小化内存使用。不需要先存储到磁盘。