代码之家  ›  专栏  ›  技术社区  ›  Yu Chen little_birdie

对Spark scala代码库所做的更改不会在运行时反映出来

  •  0
  • Yu Chen little_birdie  · 技术社区  · 7 年前

    然而,当我重建并运行Spark时,我对代码库所做的任何更改似乎都没有反映出来。例如,在 spark-shell REPL,初始化将打印

    Spark context Web UI available at [some address and port] . 这部分来自 repl.src.main.scala.org.apache.spark.repl.SparkILoop.scala link to Github here ),作为 initializationCommands 价值

    1. 我试着简单地加上 println(s"Spark context Web UI available at ${webUrl}!!!!"
    2. build/sbt clean package
    3. 我开始我的火花壳 bin/spark-shell 感叹号将出现在控制台中。他们没有。我得到了

    为了不泄气,我注意到 18/11/28 08:09:20 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 当Spark(和Spark shell)第一次加载到本地机器上(使用Hadoop)时,通常打印为日志消息。很明显,它能够记录警告消息。

    我试图通过向 SparkContext 中的构造函数 SparkContext class definition sc 在火花壳内。我在中编辑了以下几行

    class SparkContext(config: SparkConf) extends Logging {
    
      logWarning("Hello!!!!")
      /* rest of the constructor code is below */
    

    同样,我遵循了相同的清理和构建过程,并希望看到一些日志消息 Hello!!!!

    同样,我看到了没有本机Hadoop的默认警告消息,但没有看到我自己的消息。

    1 回复  |  直到 7 年前
        1
  •  0
  •   Yu Chen little_birdie    7 年前

    结果是我犯了一个愚蠢的错误。我有一个现有的火花安装设置和配置(为实际工作,而不是涂鸦)。我更改了我的环境变量,但从未获取bash概要文件。明确地说,你应该

    export SPARK_HOME=path/to/your/spark/source/code
    

    source ~/.bash_profile 或者存储环境变量的任何位置。

    spark-shell ,它仍然指向我现有的Spark安装。

    推荐文章