我们可能经常会遇到这样的情况,需要将别人发过来的word文档转为pdf格式,数量少的时候一个个打开另存为即可,但是有时候动不动十几个文件,一个个弄就太麻烦了,最近也遇到了这样的问题,与大家分享一下


环境准备:

关键函数:

#doc --> pdf
def doc2pdf(input_file):
    word = Dispatch('Word.Application')
    doc = word.Documents.Open(input_file)
    doc.SaveAs(input_file.replace(".docx", ".pdf"), FileFormat=wdFormatPDF)
    doc.Close()
    word.Quit()
#recurse a file
for root, dirs, filenames in walk(directory):

完整代码如下(遍历整个文件夹,将所有word文件转为pdf)

from win32com.client import Dispatch
from os import walk

wdFormatPDF = 17


def doc2pdf(input_file):
    word = Dispatch('Word.Application')
    doc = word.Documents.Open(input_file)
    doc.SaveAs(input_file.replace(".docx", ".pdf"), FileFormat=wdFormatPDF)
    doc.Close()
    word.Quit()


if __name__ == "__main__":
    doc_files = []
    directory = "C:\\Users\\xkw\\Desktop\\destData"
    for root, dirs, filenames in walk(directory):
        for file in filenames:
            if file.endswith(".doc") or file.endswith(".docx"):
                doc2pdf(str(root + "\\" + file))

注意:python3里面没有win32这个package,对应的package为pywin32,github在这里