|
1
1
当前格式的数据可以称为 交错的 ,即有多种不同类型的记录,但它们之间的唯一关系是它们在文件中的位置。这种结构提供了一个用JSON表示的有趣挑战,JSON是一种 对象 符号aslos被称为a 图表 分层数据的分类。
集合中的两种记录类型是:
因为这些记录之间存在1:1的关系,所以在JSON输出中将其中一条记录嵌套在另一条记录中没有任何价值。两条记录之间也没有共享/公共字段,两条记录之间也没有链接字段。这意味着每条记录都相互依赖。 从消费者的角度来看,索引本身是没有意义的,索引的设计通常是为了方便快速搜索或引用记录。 因为这里的任务是逐行处理数据 和 我们已经发现,生成嵌套结构没有什么价值 和 没有公共字段,这个交错的数据集可以很容易地合并或删除 扁平的 变成一个简单的单记录数组
为了平展这些数据,我们从 指数 记录,并将其注入 文本输入 ,在本例中,我还展平了索引结构,它本身就是一个嵌套对象:
实现这一目标的步骤:
4.和5。可以反转,从自动化的角度来看,我发现这是一种更容易确保最后一行的方法 没有逗号 需要考虑的事项:
在平展索引之后,我还建议更改
总的来说,这个文件中字段的名称是直观的,但是如果文件本身很大(如果这是一个问题…),那么,然后,通过减少其他字段的名称,例如
在优化数据馈送时,您需要在理论上可以实现的内容和实际可用资源之间找到平衡 和 消费者。
在当前示例中,如果文件中的每个记录对某个字段都有相同的值,则可以完全删除该字段
如果需要考虑跨线路的字节,并且您希望坚持使用JSON,那么可以选择将数据规范化为嵌套对象图,您应该使用某种映射或翻译服务来实现这一点,或者编写代码,我不会手动尝试,但它可能看起来像是按以下顺序嵌套的数组:
如果你要把它处理成一个标准化的结构,它可能看起来像这样:
对于一个大文件(删除了空格),虽然仍然可以通过表达式语法轻松定位图中的节点,但可能会产生显著的差异,重要的是没有丢失任何信息。 |
|
Sweepy Dodo · JSON lite的格式化 1 年前 |
|
|
user24242514 · 将嵌套查询字符串请求转换为字典 1 年前 |
|
|
Shane Harley · 通过这些JSON元素进行映射 1 年前 |
|
|
Shane Harley · 将HTML作为JSON字符串的一部分? 1 年前 |
|
|
Matt Miles · 如何将嵌套的JSON转换为数据帧? 1 年前 |