|
|
1
0
让我提供一些解决方案。 我想/mnt/b古铜/{something}是您着陆文件的暂存区,并且您希望防止读取以前着陆的文件。 您在当前笔记本的末尾有一些选项:
PD:如果你选择2),我建议在tmp/dir的路径中添加一些基于时间戳的规则,以确保它保持有序和干净。例如
|
|
|
JFlo · 在PySpark笔记本中读取多个Parquet文件 1 年前 |
|
|
Aaron · Databricks SQL中行到列的动态转换 1 年前 |
|
|
Desert Spider · 使用多个分隔符拆分sql 2 年前 |
|
|
Idiot · Spark-处理后移动文件 2 年前 |
|
|
Sarath Subramanian · 处理来自cat命令的错误消息 2 年前 |