Python讀取word文本操作詳解-創(chuàng)新互聯(lián)

本文研究的主要問題時(shí)Python讀取word文本操作,分享了相關(guān)概念和實(shí)現(xiàn)代碼,具體如下。

綿陽網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián),綿陽網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為綿陽上千余家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\外貿(mào)網(wǎng)站建設(shè)要多少錢,請找那個(gè)售后服務(wù)好的綿陽做網(wǎng)站的公司定做!

一,docx模塊

Python可以利用python-docx模塊處理word文檔,處理方式是面向?qū)ο蟮?。也就是說python-docx模塊會(huì)把word文檔,文檔中的段落、文本、字體等都看做對象,對對象進(jìn)行處理就是對word文檔的內(nèi)容處理。

二,相關(guān)概念

如果需要讀取word文檔中的文字(一般來說,程序也只需要認(rèn)識(shí)word文檔中的文字信息),需要先了解python-docx模塊的幾個(gè)概念。

1,Document對象,表示一個(gè)word文檔。
2,Paragraph對象,表示word文檔中的一個(gè)段落
3,Paragraph對象的text屬性,表示段落中的文本內(nèi)容。

三,模塊的安裝和導(dǎo)入

需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗(yàn)英文水平。)

Python讀取word文本操作詳解

注意在導(dǎo)入模塊時(shí),用的是import docx。

也真是奇了怪了,怎么安裝和導(dǎo)入模塊時(shí),很多都不用一個(gè)名字,看來是很有必要出一個(gè)python版本的模塊管理程序python-maven了,本段純屬PS。

四,讀取word文本

在了解了上面的信息之后,就很簡單了,下面先創(chuàng)建一個(gè)D:\temp\word.docx文件,并在其中輸入如下內(nèi)容。

Python讀取word文本操作詳解

然后寫一段程序,代碼及輸出結(jié)果如下:

#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數(shù):"+str(len(file.paragraphs)))#段落數(shù)為13,每個(gè)回車隔離一段

#輸出每一段的內(nèi)容
for para in file.paragraphs:
 print(para.text)

#輸出段落編號(hào)及段落內(nèi)容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的內(nèi)容是:"+file.paragraphs[i].text)

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

當(dāng)前名稱:Python讀取word文本操作詳解-創(chuàng)新互聯(lián)
分享URL:http://muchs.cn/article12/dsicgc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站、建站公司、企業(yè)網(wǎng)站制作、自適應(yīng)網(wǎng)站、App設(shè)計(jì)、網(wǎng)站設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作