代码之家  ›  专栏  ›  技术社区  ›  Michael

如何在HADOOP\u CONF\u DIR中指定集群位置?

  •  2
  • Michael  · 技术社区  · 7 年前

    火花 documentation 关于提交申请,请说明:

    根据--deploy mode的值,以客户端或集群模式连接到纱线集群。集群位置将基于HADOOP\u CONF\u DIR或YARN\u CONF\u DIR变量找到。

    恐怕我没有弄明白。我发现了 HADOOP_CONF_DIR 设置为 /etc/hadoop 它包含许多shell脚本和配置文件。

    我应该在哪里找到集群的具体位置?

    1 回复  |  直到 7 年前
        1
  •  2
  •   Jacek Laskowski    7 年前

    HADOOP_CONF_DIR 是包含Hadoop库用于各种Hadoop特定内容的配置文件的目录。我写道 各种特定于Hadoop的东西 要强调的是,这里没有太多与Spark相关的内容。

    更重要的是 HADOOP\u CONF\u目录 也可以指向一个空目录(表示采用默认值)。

    要回答您的问题,可以在中定义集群位置 yarn-site.xml 使用 yarn.resourcemanager.address 如果 yarn-site.xml 未找到,纱线簇可在本地主机上使用。

    我应该放在哪里 纱线现场。xml 所以 spark-submit 会使用它吗?

    我以前用过 YARN_CONF_DIR 指向目录 纱线现场。xml

    YARN_CONF_DIR=/tmp ./bin/spark-shell --master yarn