您現在的位置是:首頁 > 棋牌
python 處理word文件實現自動化辦公
- 由 程式猿小董 發表于 棋牌
- 2023-01-11
c上0下2等於多少
工作中經常會處理Word文件,如果有很多文件也是一件很頭痛的事,特別都是同樣的處理方式,一樣的工作重複一遍又一遍真是讓人抓狂。Python可以解決這個問題,執行一個Python指令碼就能輕鬆完成這種重複的工作,從而提高工作效率。
python-docx是Python處理Word文件的一個第三方庫,使用方法簡單方便,處理速度也很快。
python-docx
安裝
開啟命令列工具,使用命令pip install python-docx進行安裝,如圖所示:
我這裡是已經安裝過的,所以顯示是這樣的。
使用python-docx庫進行開發首先要匯入相關的類,再進行相關的開發。
直接建立生成docx文件
在電腦上我們手動建立一個docx文件,我們可以看到有文件名、段落、字型樣式設定、圖片等等。在程式碼裡也需要這些東西,實戰程式碼如下圖所示:
文件中還可以插入表格,如圖所示:
執行結果
使用命令”python 指令碼路徑 ”執行程式碼,或者在Pycharm裡右鍵程式碼,執行結果如下所示:
批次生成docx文件
我們可以使用使用python-docx庫批次生成docx文件,是不是比手動一個個建立可快速多了呢。程式碼如下圖所示:
執行結果如下圖所示:
開啟文件看看內容,如下圖所示:
使用模板生成docx文件
我們還可以使用模板,利用模板裡現有內容,加以修改生成新的文件。程式碼如下圖所示:
這裡在run裡而不是在paragraph裡替換文件內容的原因是在paragraph裡替換原來文件裡的格式會消失。
執行結果如下圖所示:
docx文件讀取
docx文件讀取有兩種方式,一種是利用python-docx庫讀取,還有一種是利用zipfile庫進行讀取。
python-docx讀取docx文件
python-docx讀取docx文件比較簡單,程式碼如下圖所示:
執行結果如下圖所示:
zipfile讀取docx文件
zipfile庫是一個處理壓縮檔案的庫,為什麼可以用來讀取docx文件呢,原來docx文件使用zip作為儲存方式,文件內容以xml的形式儲存在zip壓縮檔案裡。我們把docx文件字尾改為zip,開啟壓縮檔案看看,內容如下圖所示:
裡面的文件開啟如下圖所示:
讀取docx文件的程式碼如下圖所示:
執行結果如下圖所示:
docx文件轉PDF文件
python也可以實現docx文件轉PDF文件,使用的是win32com庫,實際上就是呼叫Windows程式來實現的。
程式碼如下圖所示:
執行結果如下圖所示:
注意:
python-docx庫只支援docx文件,不支援doc文件,想處理doc文件可以先轉換為docx文件就可以使用了
。
Python 3。5從零開始學
劉宇宙
計算機
免費閱讀
更多的python程式設計知識可以從這本書中學習,很適合剛開始接觸python的新手同學,大家有興趣可以看看。
想了解更多精彩內容,快來關注程式猿小董