代码之家 › 专栏 › 技术社区 › Robert Strauch

groovy:使用streamingmarkupbuilder处理大量数据

out-of-memory memory-management groovy xml

Robert Strauch · 技术社区 · 15 年前

场景如下。我有一个纯文本文件,其中包含2000000行和一个ID。这个ID列表需要转换为一个简单的XML文件。只要输入文件中只有几千个条目,以下代码就可以正常工作。

def xmlBuilder = new StreamingMarkupBuilder()
def f = new File(inputFile)
def input = f.readLines()
def xmlDoc = {
  Documents {
    input.each {
      Document(myAttribute: it)
    }
  }
}

def xml = xmlBuilder.bind(xmlDoc)
f.write(xml)

如果处理了2000000个条目,我将获得Java堆的OutOfMeMyExeExchange(设置为1024M)。有没有办法改进上述代码,使其能够处理大量数据?

干杯, 罗伯特

2 回复 | 直到 15 年前

tim_yates 15 年前

这个解决方案的问题是,在写出来之前,它正在将所有的东西加载到内存中…

这可能是一个更好的解决方案,因为我认为它应该将数据写到文件中。 output.xml 随着它的进程 input.txt .

import groovy.xml.MarkupBuilder

new File( 'output.xml' ).withWriter { writer ->
  def builder = new MarkupBuilder( writer )
  builder.Documents {
    new File( 'input.txt' ).eachLine { line ->
      Document( attr: line )
    }
  }
}

Steven 15 年前

这是您的问题:def输入=f.readlines()。 ;-)

推荐文章

Aleks · JSR223预处理器。将数据从数组传递到请求后参数

2 年前

sirius78m · 是什么做的。+运算符在这个代码中做什么?[副本]

2 年前

R_SS · 用于json键数组的groovy jsonBuilder

2 年前

manuel_b · Regex匹配器返回多个值

2 年前

snbmt21 · 如何在Groovy中使用CollectEntries来创建每个键都有多个值的映射

2 年前

user22946701 · 将列表中的每个元素封装为平面文件中的新行

2 年前

Vivek Sangode · micronaut-java中的多租户

2 年前

Mofis Khan · 在groovy脚本上调用shell命令

2 年前

Mouna Camelia Hammoudi · 如果问题没有组件,则显示新页面而不是对话框

2 年前

Gaylord.P · 将配置与groovy连接

2 年前