代码之家 › 专栏 › 技术社区 › hamdog

将大查询数据流加载到空分区

apache-beam google-cloud-dataflow google-bigquery python

hamdog · 技术社区 · 7 年前

使用ApacheBeampython SDK,我已经建立了一个数据流,它在大查询中写入日期分区表中的各个分区。根据 this documentation 每个日期分区表都有特殊的 NULL 和 UNPARTITIONED 分区。根据这些文件,我可以写信给 未分区的 只需将我的日期设置在过去或将来,但我如何才能写入 无效的 分区?

我正在尝试根据数据中的值将数据加载到分区,有时字段为空。我宁愿写信给 无效的 分区而不是组成一个用于空值的日期。

作为参考,我写了一些像这样的分区的最新操作:

beam.io.Write(beam.io.BigQuerySink(table_id+'$20180925',
    project=project_id, dataset=dataset_id, schema=schema))

我需要换什么 $20180925 要写信给 无效的 ?

1 回复 | 直到 7 年前

Pavan Edara 7 年前

这个 无效的 分区仅在由数据中的列分区的表中可用,而不是在接收时间分区表时可用。如果要写入列分区表,则不能简单地在特定行中填充该列的值,并使用表ID(不带任何分区后缀)写入 无效的 分区。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

11 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

11 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

11 月前

user29715306 · from_users=和chats=电视节目中的差异

11 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

12 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

12 月前

prayner · 更新嵌套字典包含列表中的项

12 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前