![]() |
1
1
也许这就是你的意思。。。底层引擎是相同的。我想一个更好的类比是
Pyspark是“Spark”,就像httplib和okhttp是http一样
.它为您提供了一个调用相同核心引擎的API。当Spark在JVM上运行时,我们用JVM语言(如Scala或Java)编写的驱动程序直接使用API,但使用Python API编写的程序要通过JVM上运行的Python解释器。不过,这是一个实施问题。
如果你为Spark调用Python API,用Python编写驱动程序,那么你就是在做Pyspark
现在,在这一切之后,值得一提的是 Pyspark 是其中的一部分 Spark 生态系统。只是我们没有流行的名字 Spark与Scala (“ScalaSpark”?)或 Spark与Java 正如我们所拥有的 Pyspark 和 SparkR . |