代码之家  ›  专栏  ›  技术社区  ›  AphexMunky

获取外部PDF中使用的嵌入字体列表

  •  0
  • AphexMunky  · 技术社区  · 16 年前

    我一直在尝试使用IText来获取外部PDF中使用的嵌入字体列表。我是否遗漏了什么,或者这只是没有很好的记录?有人能给我解释一下吗,或者提出一个替代方案?首选字体名称和任何相关数据。

    1 回复  |  直到 16 年前
        1
  •  0
  •   Kevin Day    16 年前

    你试过什么?字体通常是在与每个页面相关联的字典中捕获的,因此如果您抓取页面字典,然后查找字体的子字典等…你会找到的。

    如果您有IText的最新版本(SVN的head),请查看文本解析器。其中有一个工具,除了在页面上转储文本外,还转储字典结构,包括字体信息。

    如果讨论“字典”等…还不清楚,您可能需要至少从简要阅读PDF规范开始(Adobe在他们的网站上有它)。您可能在IText中找不到从页面获取字体的方法,但您可以获取字典,在pdf中,字典定义了所有内容(包括字体)。

    推荐文章