代码之家  ›  专栏  ›  技术社区  ›  Stepan Yakovenko

没有hadoop,apachemahout ALS能工作吗?

  •  5
  • Stepan Yakovenko  · 技术社区  · 7 年前

    Exception in thread "main" java.lang.NullPointerException at java.lang.ProcessBuilder.start(ProcessBuilder.java:1012) at org.apache.hadoop.util.Shell.runCommand(Shell.java:445) at org.apache.hadoop.util.Shell.run(Shell.java:418) at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:650) at org.apache.hadoop.util.Shell.execCommand(Shell.java:739)

    命令行帮助提到了使用文件系统,但它似乎想要hadoop。如何在Windows上运行,mahout.cmd文件已损坏:

    "===============DEPRECATION WARNING===============" "This script is no longer supported for new drivers as of Mahout 0.10.0" "Mahout's bash script is supported and if someone wants to contribute a fix for this" "it would be appreciated."

    1 回复  |  直到 7 年前
        1
  •  0
  •   Tiago Peres damanpreet singh    7 年前

    “Apache Mahout是最早也是最著名的大数据机器之一 学习平台。它在上面实现了机器学习算法

    -蒂沃里,C(2015). Learning Apache Mahout .

    apachespark是一个开源的内存通用计算系统,可以在Windows和类Unix系统上运行。Spark没有使用Hadoop那样的基于磁盘的计算,而是使用集群内存将所有数据上传到内存中,并且这些数据可以重复查询。

    “随着Spark在数据科学家中越来越受欢迎,Mahout 社区也在迅速努力使Mahout算法发挥作用 快了好几倍。Mahout为 使用Spark创建建议。”

    -Gupta,A(2015年)。 Learning Apache Mahout Classification

    (这最后一本书还提供了一个逐步的指南 使用Mahout的火花壳 (他们不使用Windows,也不清楚是否使用Hadoop)。有关该主题的更多信息,请参阅 https://mahout.apache.org/users/sparkbindings/play-with-shell.html .)

    除此之外,您还可以使用Spark构建推荐引擎,如中提供的数据帧、RDD、管道和转换 Spark MLlib

    在Spark中,(…)交替最小二乘法( ALS 生成基于模型的协同过滤。

    -戈拉卡拉,S(2016). Building Recommendation Engines .

    can we run Spark without Hadoop? .

    所以,