![]() |
1
2
为了能够在SQL查询中访问DataFrame,请使用方法将其注册为临时视图 DataFrame.createOrReplaceTempView :
|
![]() |
2
1
您的SQL语句需要一个表的名称——您不能放DataFrame对象,它们不等效。DataFrame不一定有名称,因为它可能是您加载的DataFrame上的某些操作的结果。 如果您希望此函数始终接受表作为参数,那么只需传递名称(字符串)即可。 如果你预计有时它可能会得到一个DataFrame,这是其他操作的结果,那么你不能将select构建为SQL语句,但你可以通过应用pyspark函数来添加它,就像这样
|
![]() |
Kevin Smeeks · Pyspark JDBC分区读取 5 月前 |
![]() |
user3579222 · 阅读以前的Spark API 5 月前 |
![]() |
JFlo · 在PySpark笔记本中读取多个Parquet文件 6 月前 |
![]() |
Matthew Thomas · partition覆盖动态和“逻辑”分区 10 月前 |
![]() |
lenpyspanacb · 在Pyspark中计算重复次数 10 月前 |
![]() |
maximodesousadias · 如何根据条件删除日期后的记录 11 月前 |