Python自然語言處理NLTK庫用法入門教程【經(jīng)典】-創(chuàng)新互聯(lián)

本文實例講述了Python自然語言處理 NLTK 庫用法。分享給大家供大家參考,具體如下:

成都創(chuàng)新互聯(lián)公司2013年至今,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目網(wǎng)站設(shè)計制作、成都網(wǎng)站建設(shè)網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元曲靖做網(wǎng)站,已為上家服務(wù),為曲靖各地企業(yè)和個人服務(wù),聯(lián)系電話:028-86922220

在這篇文章中,我們將基于 Python 討論自然語言處理(NLP)。本教程將會使用 Python NLTK 庫。NLTK 是一個當(dāng)下流行的,用于自然語言處理的 Python 庫。

那么 NLP 到底是什么?學(xué)習(xí) NLP 能帶來什么好處?

簡單的說,自然語言處理( NLP )就是開發(fā)能夠理解人類語言的應(yīng)用程序和服務(wù)。

我們生活中經(jīng)常會接觸的自然語言處理的應(yīng)用,包括語音識別,語音翻譯,理解句意,理解特定詞語的同義詞,以及寫出語法正確,句意通暢的句子和段落。

NLP的作用

正如大家所知,每天博客,社交網(wǎng)站和網(wǎng)頁會產(chǎn)生數(shù)億字節(jié)的海量數(shù)據(jù)。

有很多公司熱衷收集所有這些數(shù)據(jù),以便更好地了解他們的用戶和用戶對產(chǎn)品的熱情,并對他們的產(chǎn)品或者服務(wù)進行合適的調(diào)整。

這些海量數(shù)據(jù)可以揭示很多現(xiàn)象,打個比方說,巴西人對產(chǎn)品 A 感到滿意,而美國人卻對產(chǎn)品 B 更感興趣。通過NLP,這類的信息可以即時獲得(即實時結(jié)果)。例如,搜索引擎正是一種 NLP,可以在正確的時間給合適的人提供適當(dāng)?shù)慕Y(jié)果。

但是搜索引擎并不是自然語言處理(NLP)的唯一應(yīng)用。還有更好更加精彩的應(yīng)用。

NLP的應(yīng)用

以下都是自然語言處理(NLP)的一些成功應(yīng)用:

  • 搜索引擎,比如谷歌,雅虎等等。谷歌等搜索引擎會通過NLP了解到你是一個科技發(fā)燒友,所以它會返回科技相關(guān)的結(jié)果。
  • 社交網(wǎng)站信息流,比如 Facebook 的信息流。新聞饋送算法通過自然語言處理了解到你的興趣,并向你展示相關(guān)的廣告以及消息,而不是一些無關(guān)的信息。
  • 語音助手,諸如蘋果 Siri。
  • 垃圾郵件程序,比如 Google 的垃圾郵件過濾程序 ,這不僅僅是通常會用到的普通的垃圾郵件過濾,現(xiàn)在,垃圾郵件過濾器會對電子郵件的內(nèi)容進行分析,看看該郵件是否是垃圾郵件。

NLP庫

現(xiàn)在有許多開源的自然語言處理(NLP)庫。比如:

  • Natural language toolkit (NLTK)
  • Apache OpenNLP
  • Stanford NLP suite
  • Gate NLP library

自然語言工具包(NLTK)是最受歡迎的自然語言處理(NLP)庫。它是用 Python 語言編寫的,背后有強大的社區(qū)支持。

NLTK 也很容易入門,實際上,它將是你用到的最簡單的自然語言處理(NLP)庫。

在這個 NLP 教程中,我們將使用 Python NLTK 庫。在開始安裝  NLTK 之前,我假設(shè)你知道一些 Python入門知識。

安裝 NLTK

如果你使用的是 Windows , Linux 或 Mac,你可以 使用PIP 安裝NLTK: # pip install nltk。

在本文撰寫之時,你可以在 Python 2.7 , 3.4 和 3.5 上都可以使用NLTK?;蛘呖梢酝ㄟ^獲取tar 進行源碼安裝。

要檢查 NLTK 是否正確地安裝完成,可以打開你的Python終端并輸入以下內(nèi)容:Import nltk。如果一切順利,這意味著你已經(jīng)成功安裝了 NLTK 庫。

一旦你安裝了 NLTK,你可以運行下面的代碼來安裝 NLTK 包:

import nltk
nltk.download()

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

文章題目:Python自然語言處理NLTK庫用法入門教程【經(jīng)典】-創(chuàng)新互聯(lián)
文章出自:http://www.muchs.cn/article36/cdeesg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、虛擬主機、品牌網(wǎng)站制作、靜態(tài)網(wǎng)站、網(wǎng)站收錄標(biāo)簽優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)