3
|
Nagesh Singh Chauhan · 技术社区 · 7 年前 |
![]() |
1
2
您共享的旧堆栈溢出日志( Skipping header rows - is it possible with Cloud DataFlow? )包含你问题的答案。
这个选项是
当前不可用
在apache beam sdk中,虽然
开放功能请求
在apache beam jira问题跟踪程序中,
BEAM-123
. 请注意,在撰写本文时,此功能请求仍处于打开状态,尚未解决,并且已经有两年的时间了。不过,从这个意义上讲,似乎正在做一些努力,最新的更新是从2018年2月开始的,所以我建议您继续了解jira问题的最新情况,因为它最后一次被转移到
考虑到这些信息,我想说你正在使用的方法(在将文件上传到gcs之前删除头)是你的最佳选择。我将避免手动操作,因为您可以轻松编写脚本并自动执行 删除页眉 阿维 上传档案 过程。 编辑:
我已经能够想出一个简单的过滤器使用
|
|
2
2
这个密码对我有效。我使用filter.by()从csv文件中筛选出标题行。
|
![]() |
3
-2
https://medium.com/@baranitharan/the-textio-write-1be1c07fbef0 这个 TextIO.Write 在数据流中现在有 withHeader 函数向数据添加标题行。这个函数是在verison中添加的 1.7.0 . 因此,您可以将标题添加到csv中,如下所示:
WithHeader函数自动在标题行的末尾添加换行符。 |