代码之家 › 专栏 › 技术社区 › Attila O.

如何将大块数据导入PostgreSQL?

performance postgresql database sql

Attila O. · 技术社区 · 14 年前

我的数据结构如下:

Model Place
    primary key "id"

    foreign key "parent" -> Place
    foreign key "neighbor" -> Place (symmetryc)
    foreign key "belongtos" -> Place (asymmetric)

    a bunch of scalar fields ...

模型表中有超过500万行,需要插入 ~ 5000万 两个外键表中的每一个的行。我有 SQL 像这样的文件:

INSERT INTO place_belongtos (from_place_id, to_place_id) VALUES (123, 456);

它们是关于 7 GB 每一个。问题是,当我这样做的时候 psql < belongtos.sql ,这需要我大约 12小时 进口 ~ 400万 AMD Turion64x2 CPU上的行。OS为gentoo~amd64,PostgreSQL为8.4版,本地编译。data dir是一个绑定装载,位于我的第二个扩展分区上( ext4 我认为这不是瓶颈。

我怀疑插入外交关系要花这么长时间,因为 psql 检查每一行的键约束,这可能会增加一些不必要的开销,正如我所知道的,以确保数据是有效的。是否有方法加速导入,即临时禁用约束检查?

2 回复 | 直到 13 年前

Frank Heikens 14 年前

确保两个外键约束都是 DEFERRABLE
使用 COPY 加载数据
如果不能使用copy,请使用 prepared statement 为你的插入。
Propper配置设置也会有帮助,请检查 WAL 设置。

xenoterracide 14 年前

答案是肯定的… Depesz wrote an article here on deferrable uniqueness . 不幸的是,它似乎是一个9.0功能。

隐马尔可夫模型。。。也许那篇文章不适用于你的情况?看来我们能 set constraints to deferred 有一阵子…我猜独特是一种独特的情况(双关语是故意的)。

推荐文章

Nebula Tech · 在SQL Server中搜索字符串中单词的多次出现

5 月前

blogger13 · 视频租赁店数据库的规范化

5 月前

ashish · Postgres是否支持使用复合外键的“ON DELETE CASCADE”

5 月前

ì¤ì¤í · 为什么LEFT INNER JOIN被弃用?

6 月前

relatively_random · 确保两个表之间一致的共同参考

6 月前

Qi Xiang · Milvus在使用expr和vector进行搜索时是如何工作的?

9 月前

Grenish Rai · Firestore错误“用户文档不存在”

9 月前

Saijo-Shi · PLpgsql中的更新触发器

10 月前

Dante · Django::配置不当:池不支持持久连接

10 月前

YouLocalRUser · 删除重复行,保留第一行

11 月前

如何将*大*块数据导入PostgreSQL?

如何将大块数据导入PostgreSQL?