代码之家  ›  专栏  ›  技术社区  ›  Khilesh Chauhan

由于超出VM限制,MapReduce处理失败

  •  0
  • Khilesh Chauhan  · 技术社区  · 8 年前

    由于超出VM限制,MapReduce处理失败。 我们发现的只是数据的偏斜, MapReduce因数据偏斜而失败的背后是否有任何原因?

    1 回复  |  直到 8 年前
        1
  •  0
  •   tk421    8 年前

    如果您的数据扭曲得足够严重,那么这意味着一个映射器或reducer将不得不处理更多的数据。这意味着它将需要更多内存并运行更长时间。如果您积极地设置了集群的节点管理器内存,那么很容易就会淹没VM或节点。

    这是一个普遍存在的问题,而且问题很大,人们已经就此发表了论文。