代码之家  ›  专栏  ›  技术社区  ›  Aravind Yarram

num off switch containers在纱线资源管理器用户界面中的含义是什么?

  •  0
  • Aravind Yarram  · 技术社区  · 6 年前

    我有一个ETL工作占用了大量的CPU和内存,并且运行了很长时间。调试时我观察到的第一件事是(从资源管理器GUI上的作业中)以下内容

    • num节点本地容器(满足者)=6
    • num机架本地容器(满足者)=00
    • num off开关容器(满足者)=11367

    我们只有两个架子。我需要帮助回答以下三个问题

    1. num off开关容器的含义是什么?
    2. 如何识别这些“关闭开关”容器以及它们运行在哪个节点上?
    3. 关闭关闭容器是否会导致作业处理时间变慢?
    1 回复  |  直到 6 年前
        1
  •  3
  •   Taha Naqvi    6 年前

    1.num off switch containers是什么意思? 以上情况为 off switch locality 延迟调度程序:

                    | router|
                  +-----------+
                 /             \
        +-----------+        +-----------+
        |rack switch|        |rack switch|
        +-----------+        +-----------+
        | data node |        | data node |
        +-----------+        +-----------+
        | data node |        | data node |
        +-----------+        +-----------+
    

    这是数据位置(1.node local 2)最糟糕的情况。机架局部3。关闭开关 延迟调度程序 存储器和VCORE通过交换机被分配到不同的机架上,带宽更高。

    延迟调度程序将传入任务分配给位于不同机架上的关闭开关节点,以避免任务不足。

    对于纱线配置变量中的不同调度程序,节点和机架阈值存在:

    容量Sch - 有这个财产 yarn.scheduler.capacity.rack-locality-additional-delay ,关闭开关容器分配的松弛位置完成。

    容量调度程序.xml

    <property>
      <name>yarn.scheduler.capacity.node-locality-delay</name>
      <value>-1</value>
      <description>Number of missed scheduling opportunities after which the              CapacityScheduler attempts to schedule rack-local containers.
    Typically this should be set to number of racks in the cluster, this
    feature is disabled by default, set to -1.
     </description>
    </property>
    

    https://issues.apache.org/jira/browse/YARN-4189 -JIRA改进 如果集群使用公平调度程序:

    https://hadoop.apache.org/docs/r2.7.4/hadoop-yarn/hadoop-yarn-site/FairScheduler.html

    yarn.scheduler.fair.locality.threshold.rack

    https://cs.stanford.edu/~matei/papers/2010/eurosys_delay_scheduling.pdf 用于延迟调度。

    2.如何识别这些“关闭开关”容器及其运行的节点?

    要查看应用程序的容器,我认为我们需要通过尝试ID转到特定的应用程序尝试,在那里我们可以找到conatainer及其节点。我在RM UI中找不到任何与关闭开关容器的直接链接

    3.关闭开关容器是否会导致作业处理时间变慢?

    是的,从上面我们可以得出结论,网络开销将减慢工作处理。

    推荐文章