![]() |
1
1
这在一般情况下是不可能的。 如果未标记PDF文档,则文档本身不包含结构信息。或者简单地说,文档不知道哪些部分是表、表行甚至段落。 从未标记的pdf文档中提取结构信息是困难的。如果不是一般情况下说不可能的话。 使用pdf2data,您可以实现这一点。需要注意的是,必须预先定义模板。所以你需要告诉软件在哪里可以找到一张桌子。
你可以看看
在代码中的某个时刻,它决定如果缓冲区已经以空白结尾,则不应再追加空白。
我建议您创建自己的实现
|
|
Marcos Silva · 不使用X-Object压缩PDF 7 年前 |
![]() |
Arsiwaldi · 如何将PDF文档拆分为小文档 7 年前 |
![]() |
A. Schmidt · c#itextsharp绝对文本位置多行 7 年前 |