代码之家  ›  专栏  ›  技术社区  ›  Akshat Bansal

我需要转换。文件和。将文件docx到。使用python的pdf

  •  1
  • Akshat Bansal  · 技术社区  · 8 年前

    我需要转换。文件和。将文件docx到。使用python的pdf。 我已经看到了一些可用的答案,但它们正在使用comtypes和打开WordApplication。我不能那样做。 我寻求的是一种使用一些python库来实现的方法,这些库保留字体、表格、标题大小和图像等, 没有打开MS Word或LibreOffice之类的 正在转换。文件和。如果需要的话,将docx文件转换为某种中间格式(然后再将该格式转换为pdf)也可以。请帮助我完成应该遵循的代码或指导说明(我不是python专业人士)。

    1 回复  |  直到 8 年前
        1
  •  2
  •   Hari    8 年前

    我之前也遇到过类似的问题,

    我的建议:

    抱歉,没有这样的直接python库专门处理Microsoft office格式(.doc)

    因此,尝试在Ubuntu的“LibreOffice”中使用LibreOffice作为服务 如果windows为其“soffice.exe”,请在命令行中使用此命令将文档转换为。PDF不打开LibreOffice

    而且它的简单和快速太多,给几乎完美的文件转换。

    示例:

    对于Windows:

        C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"
    

    这将在给定的输出目录中将输入文件转换为pdf,而无需将其作为服务打开LibreOffice ans。

    要从python运行此命令,可以使用类似“子流程”的库。