代码之家  ›  专栏  ›  技术社区  ›  elbillaf

protege(本体论工具)可以报告读取turtle文件时出错的行号吗?

  •  0
  • elbillaf  · 技术社区  · 7 年前

    我正在生成海龟三元组,完整的数据集已经大约2GB了。在大多数测试中,我使用了几个K的小样本。然后,我尝试对完整数据集进行定期测试。它不会一直加载,但它会告诉我是否有错误。

    •   Level: INFO Time: 1504111914814 Message: ------------------------------- Loading Ontology ------------------------------- 
    •   Level: INFO Time: 1504111914815 Message: Loading ontology from file:/C:/Projects/gdelt/sample.ttl 
    •   Level: INFO Time: 1504112075814 Message: Finished loading file:/C:/Projects/gdelt/sample.ttl 
    •   **Level: ERROR Time: 1504112075818 Message: An error occurred whilst loading the ontology at GC overhead limit exceeded. Cause: {}** 
    •   Level: INFO Time: 1504112075819 Message: Loading for ontology and imports closure successfully completed in 160995 ms 
    

    加载这些示例文件可能需要很长时间,然后它只告诉我有一个错误,没有任何问题所在的指示。因此,我目前的调试方法是二进制搜索-生成一半大的文件,查看是否有错误,分割差异,检查错误,这样我可以将其缩小到几行,在其中我可以轻松检测到错误。这是 乏味的有没有办法让protege报告它呕吐的地方?

    如果没有,也许我可以使用另一个工具来检查我生成的三元组的语法?

    1 回复  |  直到 7 年前
        1
  •  2
  •   Ignazio    7 年前

    解析器中不会出现内存不足错误,因此没有提供行号。只能通过连续尝试猜测内存限制下可以加载的行数。