代码之家  ›  专栏  ›  技术社区  ›  Rafael Díaz

安装最新的起泡水版本

  •  1
  • Rafael Díaz  · 技术社区  · 6 年前

    我按照安装指南来安装苏打水,但它根本不起作用。它包括8个步骤,如您在: rsparkling中所见。

    • 步骤2的第一个问题安装旧版本的sparklyr (与spark 2.3.1不兼容) ,solved using install.packages(“https://github.com/rstudio/sparklyr/archive/v0.8.0.tar.gz”,repos=null,type=“source”).
    • spark的步骤3,版本2.3.1不可用,如命令 sparklyr::spark_available_versions()2.3.0所示。已解决直接从页面安装的问题 apache spark
    • 步骤6不起作用,请安装不受支持的版本的

    我正在尝试以下操作,下载最新版本的起泡水,解压缩文件。并使用以下代码:

    install.packages(“c:/users/user/downloads/sparkling-water-2.3.259聒nightly/rsparkling.tar.gz”,repos=null,type=“source”)
    *正在安装*源*包'rsparkling'…
    **包“rsparkling”已成功解包,并已检查MD5金额
    **
    **安装
    **为延迟加载准备包
    **帮助
    ***安装帮助索引
    **建筑包指数
    **测试是否可以加载已安装的包
    *完成(rsparkling)
    在r命令安装中
    
    
    

    到目前为止,一切似乎都很好。

    选项(rsparkling.sparkwater.version=“2.3.259_nightly”)。
    图书馆(RSparkling)
    7。接火花
    sc<-火花:火花连接(master=“local”)
    错误:版本规范2.3.259每晚无效
    
    
    < Buff行情>
    

    错误:版本规范2.3.259每晚无效

    注: 下载Sparkling Water Nightly Bleeding Edge.>a>version. 在Windows 7 R版本3.4.4上,软件包h2o、sparkr、sparklyr和连接工作正常,我只遇到与rsparkling有关的问题。

    system('spark-submit--version')
    欢迎使用
    ___
    /_/_____//_
    _\\/\/`/_/''_/
    /_ 2.3.1版。
    //
    
    使用Scala版本2.1.8,Java热点(TM)64位服务器VM,1.80E151
    分公司
    用户vanzin于2018-06-01t20:37:04z编制
    
    
    

    由于我可以解决这个问题,我安装了适当版本的rsparkling,与最新版本的h2o兼容。

    编辑问题:Well Lauren感谢链接,Now I'm working with the latest stable version of H2O 3.20.0.5 and spparkling water.但显然,我认为问题不在于rsparkling软件包,而在于Sparklyr软件包,因为Apache Spark 2.3.1的最新版本已发布(2018年6月8日),而Sparklyr 0.8.4的最新更新是(2018年5月25日),也就是说,它是在一个月前发布的(Spark 2.3.1 did not exist.&em>)。因此命令:

    spark_available_versions()。
    火花
    1 1.6.3
    2 1.6.2段
    3 1.6.1段
    4 1.6.0节
    5 2.0.0条
    6 2.0.1条
    7 2.0.2条
    8 2.1.0条
    9 2.1.1段
    10 2.2.0条
    11.2.2.1
    12 2.3.0条
    
    #设置火花连接
    SC<-火花连接(master=“local”,version=“2.3.1”)不工作
    spark_install_find出错(version,hadoop_version,latest=false,hint=true):
    未安装Spark版本。要安装,请使用spark_install(version=“2.3.1”)。
    spark_install(version=“2.3.1”)。
    spark_install_find出错(version,hadoop_version,installed_only=false,:
    Spark版本不可用。使用spark_available_versions()查找可用版本
    sc<-spark_connect(master=“local”)工作正常
    
    
    

    我认为解决方案将等待Sparklyr 0.9.0

    enter image description here

    • 步骤2的第一个问题安装旧版本的Sparklyr(与Spark 2.3.1不兼容),使用解决install.packages("https://github.com/rstudio/sparklyr/archive/v0.8.0.tar.gz", repos = NULL, type="source")
    • spark版本2.3.1的步骤3不可用,如命令所示sparklyr::spark_available_versions() #2.3.0. 已解决直接从页面安装Apache Spark.
    • 步骤6不工作,请安装不支持的版本rsparkling使用H2O,packageVersion("h2o") #'3.21.0.4359'

    我正在尝试以下操作,下载最新版本的起泡水,解压缩文件。并使用以下代码:

    install.packages("C:/Users/USER/Downloads/sparkling-water-2.3.259_nightly/rsparkling.tar.gz", repos=NULL, type="source")
    * installing *source* package 'rsparkling' ...
    ** package 'rsparkling' successfully unpacked and MD5 sums checked
    ** R
    ** inst
    ** preparing package for lazy loading
    ** help
    *** installing help indices
    ** building package indices
    ** testing if installed package can be loaded
    * DONE (rsparkling)
    In R CMD INSTALL
    

    到这里为止一切都很好。

    options(rsparkling.sparklingwater.version = "2.3.259_nightly")
    library(rsparkling)
    # 7. Connect to Spark
    sc <- sparklyr::spark_connect(master = "local")
    Error: invalid version specification ‘2.3.259_nightly’
    

    错误:版本规范2.3.259每晚无效

    注: 下载Sparkling Water Nightly Bleeding Edge版本。 在Windows7R版本3.4.4上,包h2o、sparkr、sparklyr和连接工作正常,我只在R停车.

    system('spark-submit --version')
    Welcome to
          ____              __
         / __/__  ___ _____/ /__
        _\ \/ _ \/ _ `/ __/  '_/
       /___/ .__/\_,_/_/ /_/\_\   version 2.3.1
          /_/
    
    Using Scala version 2.11.8, Java HotSpot(TM) 64-Bit Server VM, 1.8.0_151
    Branch 
    Compiled by user vanzin on 2018-06-01T20:37:04Z
    

    因为我可以解决这个问题,所以我安装了R停车,与最新版本的H2O.

    编辑问题:劳伦,谢谢你的链接,现在我正在研究最新稳定版本的H2O 3.20.0.5和SPParkling Water。但显然,我认为问题不在于rsparkling软件包,而在于Sparklyr软件包,因为Apache Spark 2.3.1的最新版本已发布(2018年6月8日),而Sparklyr 0.8.4的最新更新是(2018年5月25日),也就是说,它是在一个月前发布的。(spark 2.3.1不存在)因此,命令:

    spark_available_versions()
       spark
    1  1.6.3
    2  1.6.2
    3  1.6.1
    4  1.6.0
    5  2.0.0
    6  2.0.1
    7  2.0.2
    8  2.1.0
    9  2.1.1
    10 2.2.0
    11 2.2.1
    12 2.3.0
    
    # Set spark connection
    sc <- spark_connect(master = "local", version = "2.3.1") #It does not work
    Error in spark_install_find(version, hadoop_version, latest = FALSE, hint = TRUE) : 
    Spark version not installed. To install, use spark_install(version = "2.3.1")
    spark_install(version = "2.3.1")
    Error in spark_install_find(version, hadoop_version, installed_only = FALSE,  : 
    Spark version not available. Find available versions, using spark_available_versions()
    sc <- spark_connect(master = "local") #it works perfectly
    

    我想解决办法是等待Sparklyr 0.9.0

    3 回复  |  直到 6 年前
        1
  •  1
  •   Lauren    6 年前

    夜间下载页面用于简单的环境,而不是捕获所有可能的配置。

    但是,由于这个问题是特定于Windows的,因此您可以找到有关如何在Windows环境中使用起泡水的文档。 here 以及如何在Windows环境中使用rsparkling here (请注意,这些是最新的稳定版,但对于夜间发行版,说明应类似)。

        2
  •  1
  •   Rafael Díaz    6 年前

    首先安装最新版本的Sparklyr并连接到Spark

    库(sparklyr)
    spark_install(version=“2.3.2”)。
    SC<-火花连接(master=“local”,version=“2.3.2”)
    

    安装正确版本的H2O:

    install.packages(“h2o”,type=“source”,repos=“https://h2o release.s3.amazonaws.com/h2o/rel-wright/10/r”)。
    包装偏差(“H2O”)
    [1]3.20.0.10条
    

    验证起泡水与水的相容性。

    rsparkling::h2o_release_table()[1:5,]
    spark_version sparkling_water_version h2o_version h2o_release_name h2o_release_patch_编号
    1 2.3 2.3.16 3.20.0.10相对赖特10
    17 2.3 2.3.15 3.20.0.9赖特9号
    16 2.3 2.3.14 3.20.0.8版本赖特8
    15 2.3 2.3.13 3.20.0.7版本赖特7
    14 2.3 2.3.12 3.20.0.6版本赖特6
    

    设置要与rsparkling一起使用的起泡水版本

    选项(rsparkling.sparkwater.version=“2.3.16”)
    图书馆(RSparkling)
    

    现在,h2oContext可用,我们可以使用R中可用的任何h2o功能。 水环境(SC) org.apache.spark.h2o.h2oContext(上下文)

    起泡水上下文: *H2O名称:sparkling-water-user_local-1539839100465 *簇大小:1 *已用节点列表: (执行器ID、主机、端口) -------------------- (驾驶员,127.0.0.154321) -------------------- 在浏览器中打开h2o流:http://127.0.0.1:54321(在Mac OSX中按Cmd+Click) 水流量(sc)
    
    

    初始化spark ui

    现在,通过起泡水将火花与H2O结合起来,效果非常好。

    安装正确型号的H2O:

    install.packages("h2o", type = "source", repos = "https://h2o-release.s3.amazonaws.com/h2o/rel-wright/10/R")
    packageVersion("h2o")
    [1] ‘3.20.0.10’
    

    验证起泡水与水的相容性。

    rsparkling::h2o_release_table()[1:5,]
       Spark_Version Sparkling_Water_Version H2O_Version H2O_Release_Name H2O_Release_Patch_Number
    1            2.3                  2.3.16   3.20.0.10       rel-wright                       10
    17           2.3                  2.3.15    3.20.0.9       rel-wright                        9
    16           2.3                  2.3.14    3.20.0.8       rel-wright                        8
    15           2.3                  2.3.13    3.20.0.7       rel-wright                        7
    14           2.3                  2.3.12    3.20.0.6       rel-wright                        6
    

    设置要与rsparkling一起使用的起泡水版本

    options(rsparkling.sparklingwater.version = "2.3.16")
    library(rsparkling)
    

    现在,h2oContext可用,我们可以使用R中可用的任何h2o功能。 水环境(SC) org.apache.spark.h2o.h2oContext(上下文)

    Sparkling Water Context:
     * H2O name: sparkling-water-USER_local-1539839100465
     * cluster size: 1
     * list of used nodes:
      (executorId, host, port)
      ------------------------
      (driver,127.0.0.1,54321)
      ------------------------
    
      Open H2O Flow in browser: http://127.0.0.1:54321 (CMD + click in Mac OSX)
    
    h2o_flow(sc)
    

    初始化Spark UI

    enter image description here

    现在,火花通过起泡的水与水的混合物完美结合。

        3
  •  0
  •   sm1231    6 年前

    尽管您的问题特定于Windows,但您可能希望尝试 this solution 在Mac上工作得很好。