您現在的位置是:首頁 > 棋牌

python 處理word文件實現自動化辦公

  • 由 程式猿小董 發表于 棋牌
  • 2023-01-11
簡介我們把docx文件字尾改為zip,開啟壓縮檔案看看,內容如下圖所示:裡面的文件開啟如下圖所示:讀取docx文件的程式碼如下圖所示:執行結果如下圖所示:docx文件轉PDF文件python也可以實現docx文件轉PDF文件,使用的是win32

c上0下2等於多少

工作中經常會處理Word文件,如果有很多文件也是一件很頭痛的事,特別都是同樣的處理方式,一樣的工作重複一遍又一遍真是讓人抓狂。Python可以解決這個問題,執行一個Python指令碼就能輕鬆完成這種重複的工作,從而提高工作效率。

python-docx是Python處理Word文件的一個第三方庫,使用方法簡單方便,處理速度也很快。

python-docx

安裝

開啟命令列工具,使用命令pip install python-docx進行安裝,如圖所示:

python 處理word文件實現自動化辦公

我這裡是已經安裝過的,所以顯示是這樣的。

使用python-docx庫進行開發首先要匯入相關的類,再進行相關的開發。

直接建立生成docx文件

在電腦上我們手動建立一個docx文件,我們可以看到有文件名、段落、字型樣式設定、圖片等等。在程式碼裡也需要這些東西,實戰程式碼如下圖所示:

python 處理word文件實現自動化辦公

python 處理word文件實現自動化辦公

文件中還可以插入表格,如圖所示:

python 處理word文件實現自動化辦公

執行結果

使用命令”python 指令碼路徑 ”執行程式碼,或者在Pycharm裡右鍵程式碼,執行結果如下所示:

python 處理word文件實現自動化辦公

批次生成docx文件

我們可以使用使用python-docx庫批次生成docx文件,是不是比手動一個個建立可快速多了呢。程式碼如下圖所示:

python 處理word文件實現自動化辦公

執行結果如下圖所示:

python 處理word文件實現自動化辦公

開啟文件看看內容,如下圖所示:

python 處理word文件實現自動化辦公

使用模板生成docx文件

我們還可以使用模板,利用模板裡現有內容,加以修改生成新的文件。程式碼如下圖所示:

python 處理word文件實現自動化辦公

這裡在run裡而不是在paragraph裡替換文件內容的原因是在paragraph裡替換原來文件裡的格式會消失。

執行結果如下圖所示:

python 處理word文件實現自動化辦公

docx文件讀取

docx文件讀取有兩種方式,一種是利用python-docx庫讀取,還有一種是利用zipfile庫進行讀取。

python-docx讀取docx文件

python-docx讀取docx文件比較簡單,程式碼如下圖所示:

python 處理word文件實現自動化辦公

執行結果如下圖所示:

python 處理word文件實現自動化辦公

zipfile讀取docx文件

zipfile庫是一個處理壓縮檔案的庫,為什麼可以用來讀取docx文件呢,原來docx文件使用zip作為儲存方式,文件內容以xml的形式儲存在zip壓縮檔案裡。我們把docx文件字尾改為zip,開啟壓縮檔案看看,內容如下圖所示:

python 處理word文件實現自動化辦公

裡面的文件開啟如下圖所示:

python 處理word文件實現自動化辦公

讀取docx文件的程式碼如下圖所示:

python 處理word文件實現自動化辦公

執行結果如下圖所示:

python 處理word文件實現自動化辦公

docx文件轉PDF文件

python也可以實現docx文件轉PDF文件,使用的是win32com庫,實際上就是呼叫Windows程式來實現的。

程式碼如下圖所示:

python 處理word文件實現自動化辦公

執行結果如下圖所示:

python 處理word文件實現自動化辦公

注意:

python-docx庫只支援docx文件,不支援doc文件,想處理doc文件可以先轉換為docx文件就可以使用了

Python 3。5從零開始學

劉宇宙

計算機

免費閱讀

更多的python程式設計知識可以從這本書中學習,很適合剛開始接觸python的新手同學,大家有興趣可以看看。

想了解更多精彩內容,快來關注程式猿小董

Top