代码之家  ›  专栏  ›  技术社区  ›  RobertF

如何在色调中加载和执行python脚本?

  •  0
  • RobertF  · 技术社区  · 6 年前

    我是一个新的Hadoop用户,正试图通过色调接口运行python脚本。

    经过一些搜索,我在Cloudera论坛中找到了一个解决方案:

    https://community.cloudera.com/t5/Web-UI-Hue-Beeswax/How-to-run-Python-script-in-Hue-through-oozie/m-p/61455

    海报上写着“解决方案是将python脚本放在hue->query->editor->spark中的libs字段中,使用python脚本的完整路径,例如:libs:/user/userxyz/myscript.py并运行查询。单击Job_uuxxxxx链接将显示脚本是否成功运行。“

    但是,我不知道如何在Hadoop分布式文件系统中加载然后执行python脚本。色调界面似乎没有显示我的根目录并允许文件上载的HDFS功能。我是从桌面将python脚本作为文本文件加载,还是有色调的编辑器?

    1 回复  |  直到 6 年前
        1
  •  1
  •   OneCricketeer Gabriele Mariotti    6 年前

    python脚本可能应该从oozie脚本任务运行 python script.py ,并将HDFS文件引用附加到工作流任务。

    如果您没有Spark代码,那么就不应该使用Spark笔记本编辑器。

    有色调的编辑吗?

    如果您单击文件浏览器中的任何文档,则会将文件下载到Hue服务器文件系统,然后重新上载,因此最好自己直接编辑和上载。

    色调界面似乎没有显示我的根目录的HDFS功能,允许文件上载

    在ini中有一个允许文件上载的配置设置 which is true by default . 如果您完全禁用了文件浏览器,或者甚至是旧版本的色调,那么它可能不存在。