python中怎么利用正則表達(dá)式篩選文本信息-創(chuàng)新互聯(lián)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)python中怎么利用正則表達(dá)式篩選文本信息,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

成都創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比集安網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式集安網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋集安地區(qū)。費(fèi)用合理售后完善,十多年實(shí)體公司更值得信賴。

文本基礎(chǔ)操作

打開文件:open(‘文件名',‘打開方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').為避免報(bào)錯(cuò),在文件名的引號前加個(gè)r.

文件打開方式:只讀——r或rt,rb為二進(jìn)制文件;打開文件前清空文件內(nèi)容——w或wt;在文末寫入——a+;

清空內(nèi)容然后在文末寫入——w+;寫到文件任意位置——r+;

關(guān)閉文件:文件打開運(yùn)行好后必須要關(guān)閉——文件名.close()>>>mytxt.close()

讀取文件中的內(nèi)容:將每行內(nèi)容,包括換行符,作為一個(gè)元素存入數(shù)組——lines=file_object.readlines(),但是這樣會(huì)把換行符也賦進(jìn)去

去除換行符——new_lines=lines.splitlines()

os包:import os 獲取文件地址——os.listdir(父文件地址)

下面附上實(shí)現(xiàn)摘要中說的功能的完整代碼:

# coding: utf-8
#讀取文本中的中英文數(shù)據(jù)并使用正則表達(dá)式將所需數(shù)據(jù)篩選入到一個(gè)新文本中
import re
import os

#zhengze函數(shù)對讀取到的數(shù)據(jù)進(jìn)行篩選,并將篩選好的數(shù)據(jù)存入數(shù)組new_lines
new_lines=[]    #申明new_lines數(shù)組
def zhengze(f):
 regex_str=".*?(l.*?e).*"
 for x in f:
  new_x = x.splitlines()  #注意:splitlines是將傳入的字符串去除'\n'之后以數(shù)組的形式傳出,而不是字符串形式
  match_obj=re.match(regex_str,new_x[0])
  if match_obj:
   new_lines.append(match_obj.group(1))
  else:
   new_lines.append('no')
 return new_lines

#獲取指定文件夾下的所有文本的絕對地址,并存入數(shù)組file_path
path=r'C:\Users\yuanlei\Desktop\new_file_txt'
file_path=[]
for filename in os.listdir(path):  #獲取path下所有文件的路徑
 file_path.append((os.path.join(path,filename)))
print file_path

#對每個(gè)文本調(diào)用正則函數(shù)進(jìn)行篩選,篩選過后的數(shù)據(jù)存入數(shù)組final
for adress in file_path:
 file_object=open(adress)
 lines = file_object.readlines( )  #將文本中的內(nèi)容以數(shù)組的形式(每行為一個(gè)元素)賦給lines
 file_object.close()
 final=zhengze(lines)
print final

#將篩選出來的數(shù)據(jù)寫入新文本re_new.txt
file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')
for x in final:
 file_2.write(x)
 file_2.write('\n')
file_2.close()

上述就是小編為大家分享的python中怎么利用正則表達(dá)式篩選文本信息了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司行業(yè)資訊頻道。

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

分享標(biāo)題:python中怎么利用正則表達(dá)式篩選文本信息-創(chuàng)新互聯(lián)
本文來源:http://www.muchs.cn/article44/peeee.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站、軟件開發(fā)、微信公眾號、全網(wǎng)營銷推廣、網(wǎng)站策劃、動(dòng)態(tài)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設(shè)