代码之家 › 专栏 › 技术社区 › John

Neo4j中的性能批量更新关系属性缓慢

py2neo cypher neo4j

John · 技术社区 · 9 年前

我正在努力有效地批量更新Neo4j中的关系属性。目标是更新约500000个关系(每个关系大约有3个属性),我将其分为1000个批次,并在单个密码语句中进行处理,

UNWIND {rows} AS row
MATCH (s:Entity) WHERE s.uuid = row.source
MATCH (t:Entity) WHERE t.uuid = row.target
MATCH (s)-[r:CONSUMED]->(t)
SET r += row.properties

然而,每批1000个节点大约需要60秒。的UUID属性上存在索引 :Entity

CREATE INDEX ON :Entity(uuid)

这意味着根据查询计划匹配关系是超高效的,

总共有6个数据库命中,查询在大约150毫秒内执行。我还在UUID属性上添加了唯一性约束,确保每个匹配只返回一个元素,

CREATE CONSTRAINT ON (n:Entity) ASSERT n.uuid IS UNIQUE

有人知道我如何进一步调试它,以理解为什么Neo4j花了这么长时间来处理关系吗?

作为参考,我使用了Neo4j 3.0.3、py2neo和Bolt。Python代码块的形式为,

for chunk in chunker(relationships): # 1,000 relationships per chunk
    with graph.begin() as tx:
        statement = """
            UNWIND {rows} AS row
            MATCH (s:Entity) WHERE s.uuid = row.source
            MATCH (t:Entity) WHERE t.uuid = row.target
            MATCH (s)-[r:CONSUMED]->(t)
            SET r += row.properties
            """

            rows = []

            for rel in chunk:
                rows.append({
                    'properties': dict(rel),
                    'source': rel.start_node()['uuid'],
                    'target': rel.end_node()['uuid'],
                })

            tx.run(statement, rows=rows)

2 回复 | 直到 9 年前

William Lyon 9 年前

尝试此查询:

UNWIND {rows} AS row
WITH row.source as source, row.target as target, row
MATCH (s:Entity {uuid:source})
USING INDEX s:Entity(uuid)
WITH * WHERE true
MATCH (t:Entity {uuid:target})
USING INDEX t:Entity(uuid)
MATCH (s)-[r:CONSUMED]->(t)
SET r += row.properties;

它使用 index hints 要强制进行索引查找,请执行以下操作: 二者都 Entity 节点,然后 Expand(Into) 运算符,它应该比 Expand(All) 和 Filter 查询计划显示的运算符。

John 9 年前

@威廉·里昂:我想知道我是否需要 WITH * WHERE true 条款我问的原因是,DB命中的数量从4增加到8,即。

PROFILE
MATCH (s:Entity {uuid:row.source})
USING INDEX s:Entity(uuid)
MATCH (t:Entity {uuid:row.target})
USING INDEX t:Entity(uuid)
MATCH (s)-[r:CONSUMED]->(t)

鉴于

PROFILE
MATCH (s:Entity {uuid:row.source})
USING INDEX s:Entity(uuid)
WITH * WHERE true
MATCH (t:Entity {uuid:row.target})
USING INDEX t:Entity(uuid)
MATCH (s)-[r:CONSUMED]->(t)

注意,使用索引提示将数据库命中数从6减少到4 :Entity 标签

推荐文章

Dev Scott · Neo4j在两个与null字段相同的更新中获取摘要更新为false

1 年前

LizzAlice · Neo4j Cypher查询包含特定节点和关系的所有路径

2 年前

ThirstForKnowledge · Spring Batch是否仍然与Spring Data Neo4j(>=7.2.1)兼容并可用?

2 年前

Nizar · Neo4j Web浏览器:显示幻影数据(服务器上不存在数据)

2 年前

albertovpd · Neo4j:在投影中使用与权重的虚拟关系

2 年前

I.F. Adams · 为什么我的Neo4J文本索引对查询性能没有影响?

3 年前

Ahmad Abdallah · 在NextJS应用程序中使用Neovis.js时发生ReferenceError

3 年前

TiMeJuMp · Neo4j:在图中搜索完全相同的子图

3 年前

Gqueee · 每次查询的执行时间

3 年前

grandouassou · 在Neo4j中查询不存在的标签时,MyBatis mapper从不返回

8 年前