代码之家  ›  专栏  ›  技术社区  ›  Alex Pryiomka

kubernetes移除吊舱故障排除

  •  0
  • Alex Pryiomka  · 技术社区  · 6 年前

    我对kuberenetes上的spark应用程序有问题。Spark驱动程序试图创建一个executor pod,但executor pod无法启动。问题是,一旦pod出现故障,spark driver就会将其移除并创建一个新的pod。新的失败也是由于同样的原因。所以,我如何从已经移除的pod中恢复日志,因为这似乎是kubernetes上的默认spark行为。此外,我也不能抓住豆荚,因为删除是即时的。我不得不想,如果我不能恢复错误,我该如何修复失败的pod问题。

    1 回复  |  直到 6 年前
        1
  •  0
  •   VAS    6 年前

    在您的情况下,实现集群日志记录会很有帮助。即使pod被重新启动或删除,其日志也将保留在日志聚合器存储器中。

    cluster logging ,但最流行的是EFK(Elasticsearch、Fluentd、Kibana)。

    实际上,你甚至可以不用Elasticsearch和Kibana。
    看看一篇优秀的文章 Application Logging in Kubernetes with fluentd by Rosemary Wang fluentd 将聚合日志放入 弗伦特 stdout 稍后使用以下命令访问:

    kubectl logs <fluentd pod>…
    
    推荐文章