用Python提取Word表格內(nèi)容

一個公司有若干個部門,一個部門有若干個員工,每一個員工填寫一份自己的信息(Word 版),然后錄入系統(tǒng),Word 表格模板如下:

創(chuàng)新互聯(lián)公司專注于牡丹網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供牡丹營銷型網(wǎng)站建設(shè),牡丹網(wǎng)站制作、牡丹網(wǎng)頁設(shè)計、牡丹網(wǎng)站官網(wǎng)定制、微信小程序服務(wù),打造牡丹網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供牡丹網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

用Python提取 Word 表格內(nèi)容

填入內(nèi)容如:

用Python提取 Word 表格內(nèi)容

首先我們需要做的就是把數(shù)據(jù)提取出來,之后我們就可以對數(shù)據(jù) 為所欲為 進(jìn)行相關(guān)操作了。

提取表格數(shù)據(jù)代碼如下:

import docx

docName = "C:/Users/Administrator/Desktop/信息.docx"

# 打開文檔

docStr = docx.Document(docName)

# 獲取Word文檔中所有表格

numTables = docStr.tables

# 把數(shù)據(jù)放到列表中

my_list = []

for table in numTables:

# 行列個數(shù)

row_count = len(table.rows)

col_count = len(table.columns)

for i in range(row_count):

row = table.rows[i].cells

for j in range(col_count):

content = row[j].text

my_list.append(content)

# 將列表改為字典格式,方便進(jìn)行相關(guān)操作

my_dict = {}

for i in range(len(my_list)):

if i % 2:

try:

# 去除單元格為空的內(nèi)容

if k:

my_dict[k] = my_list[i]

except:

pass

else:

k = my_list[i]

print(my_dict)

結(jié)果如下:

{'姓名': 'Apollo', '證件類型': '身份zheng', '證件號碼': '123456789012345678', '性別': '男', '出生日期': '2017.6.6', '狀況': '未婚', '戶籍區(qū)劃': '河北省唐山市路北區(qū)', '詳細(xì)地址': '路北區(qū)智源里1-1-2', '聯(lián)系方式': '110', '職務(wù)': ''}

當(dāng)前文章:用Python提取Word表格內(nèi)容
文章分享:http://muchs.cn/article30/pdposo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版搜索引擎優(yōu)化、Google、網(wǎng)站營銷、微信小程序網(wǎng)站導(dǎo)航

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務(wù)器托管