怎么使用python實(shí)現(xiàn)文本數(shù)據(jù)挖掘-創(chuàng)新互聯(lián)

怎么使用python實(shí)現(xiàn)文本數(shù)據(jù)挖掘?這個(gè)問(wèn)題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見(jiàn)到的。希望通過(guò)這個(gè)問(wèn)題能讓你收獲頗深。下面是小編給大家?guī)?lái)的參考內(nèi)容,讓我們一起來(lái)看看吧!

創(chuàng)新互聯(lián)建站長(zhǎng)期為上1000+客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開(kāi)放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為滄源企業(yè)提供專業(yè)的成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、外貿(mào)網(wǎng)站建設(shè),滄源網(wǎng)站改版等技術(shù)服務(wù)。擁有10余年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開(kāi)發(fā)。

常見(jiàn)的文本挖掘有以下方式:

1、讀取txt數(shù)據(jù)

In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')

2、讀取csv數(shù)據(jù)

csv文本文件是非常常用的一種數(shù)據(jù)存儲(chǔ)格式,而且其存儲(chǔ)量要比Excel電子表格大很多,下面我們就來(lái)看看如何利用Python讀取csv格式的數(shù)據(jù)文件:

In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv

3、讀取電子表格文件

這里所說(shuō)的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數(shù)據(jù)都是存放在Excel電子表格中的,如果我們需要使用Python對(duì)其進(jìn)行分析或處理的話,第一步就是如何讀取Excel數(shù)據(jù)。下面我們來(lái)看看如果讀取Excel數(shù)據(jù)集:

In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8')
In [8]: mydata_excel

4、讀取數(shù)據(jù)庫(kù)數(shù)據(jù)

MySQLdb模塊是一個(gè)連接Python與MySQL的中間橋梁,但目前只能在Python2.x中運(yùn)行,但不意味著Python3就無(wú)法連接MySQL數(shù)據(jù)庫(kù)。這里向大家介紹一個(gè)非常靈活而強(qiáng)大的模塊,那就是pymysql模塊。我比較喜歡他的原因是,該模塊可以偽裝成MySQLdb模塊,具體看下面的例子:

In [1]: import pymysql
In [2]: pymysql.install_as_MySQLdb()    #偽裝為MySQLdb模塊
In [3]: import MySQLdb使用Connection函數(shù)聯(lián)通Python與MySQL
In [4]: conn = MySQLdb.Connection(   ...:        host = 'localhost',   ...:        user = 'root',   ...:        password = 'snake',   ...:        port = 3306,   ...:        database = 'test',   ...:        charset='gbk')使用conn的游標(biāo)方法(cursor),目的是為接下來(lái)的數(shù)據(jù)庫(kù)操作做鋪墊。
In [5]: cursor = conn.cursor()
In [6]: sql = 'select * from memberinfo'執(zhí)行SQL語(yǔ)句
In [7]: cursor.execute(sql)Out[7]: 4
In [8]: data = cursor.fetchall()
In [9]: data

感謝各位的閱讀!看完上述內(nèi)容,你們對(duì)怎么使用python實(shí)現(xiàn)文本數(shù)據(jù)挖掘大概了解了嗎?希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

當(dāng)前文章:怎么使用python實(shí)現(xiàn)文本數(shù)據(jù)挖掘-創(chuàng)新互聯(lián)
當(dāng)前路徑:http://muchs.cn/article48/ceoeep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、網(wǎng)站設(shè)計(jì)公司品牌網(wǎng)站制作、云服務(wù)器、外貿(mào)建站電子商務(wù)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運(yùn)營(yíng)