17行Python代碼做情感分析?你也可以的

2021-02-04    分類: 網(wǎng)站建設(shè)

17行代碼跑最新NLP模型?你也可以!

  • 本次作者評(píng)測(cè)所需(防嚇退)
  1. 一臺(tái)可以上網(wǎng)的電腦
  2. 基本的python代碼閱讀能力,用于修改幾個(gè)模型參數(shù)
  3. 對(duì)百度中文NLP最新成果的濃烈興趣
  • 訓(xùn)練模型:Senta情感分析模型基本簡(jiǎn)介
  1. Senta是百度NLP開放的中文情感分析模型,可以用于進(jìn)行中文句子的情感分析,輸出結(jié)果為{正向/中性/負(fù)向}中的一個(gè),關(guān)于模型的結(jié)構(gòu)細(xì)節(jié),請(qǐng)查看Senta----github.com/PaddlePaddle/Paddlehub/demo/senta 
  • 本示例代碼選擇的是Senta-BiLSTM模型。
  • 模型來(lái)源:Paddlehub簡(jiǎn)介
  1. PaddleHub是基于PaddlePaddle開發(fā)的預(yù)訓(xùn)練模型管理工具,可以借助預(yù)訓(xùn)練模型更便捷地開展遷移學(xué)習(xí)工作。 
  • 本次評(píng)測(cè)中只使用了預(yù)訓(xùn)練模型,沒有進(jìn)行fine-tune
  • 代碼運(yùn)行環(huán)境:百度 AI studio

總結(jié)

1.模型計(jì)算耗時(shí)較小,使用體驗(yàn)不錯(cuò)。

2.成語(yǔ)情感分析方面,我專門挑選的是一些比較難從字面理解的,容易混淆情感的成語(yǔ)(比如差強(qiáng)人意被判定為消極),這些也是高考??嫉膬?nèi)容。雖然最后模型正確率只有一般,但是我認(rèn)為是可以接受的,適當(dāng)增加成語(yǔ)語(yǔ)句作為訓(xùn)練語(yǔ)料會(huì)使模型"更懂"中文。

大家有興趣的可以試一試一些比較容易從字面理解情感的成語(yǔ),我覺得得分會(huì)比本次評(píng)測(cè)的結(jié)果要好。

3.轉(zhuǎn)折語(yǔ)句情感分析本身也是對(duì)模型的一種挑戰(zhàn),實(shí)測(cè)效果為65分,個(gè)人覺得模型對(duì)于像“但是”,“雖然”這樣的詞語(yǔ)沒有足夠的attention,因?yàn)檫@些轉(zhuǎn)折詞背后的語(yǔ)義往往才是最影響整個(gè)句子的情感的,最終評(píng)分65分,個(gè)人認(rèn)為模型在這方面表現(xiàn)一般。

4.評(píng)分最好看的是具體場(chǎng)景情感分析,大概預(yù)訓(xùn)練語(yǔ)料中有大量的淘寶評(píng)價(jià)?像殺馬特 20 科比 這些小字眼是判定情感的關(guān)鍵,而模型也確實(shí)捕捉到并判斷出來(lái)了,這點(diǎn)比較讓我驚喜。

分享文章:17行Python代碼做情感分析?你也可以的
本文地址:http://www.muchs.cn/news20/99070.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、ChatGPT企業(yè)建站、營(yíng)銷型網(wǎng)站建設(shè)關(guān)鍵詞優(yōu)化、網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都做網(wǎng)站