用python如何構(gòu)建知識(shí)圖譜-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商,新人活動(dòng)買(mǎi)多久送多久,劃算不套路!

創(chuàng)新互聯(lián)為您提適合企業(yè)的網(wǎng)站設(shè)計(jì)?讓您的網(wǎng)站在搜索引擎具有高度排名,讓您的網(wǎng)站具備超強(qiáng)的網(wǎng)絡(luò)競(jìng)爭(zhēng)力!結(jié)合企業(yè)自身,進(jìn)行網(wǎng)站設(shè)計(jì)及把握,最后結(jié)合企業(yè)文化和具體宗旨等,才能創(chuàng)作出一份性化解決方案。從網(wǎng)站策劃到網(wǎng)站設(shè)計(jì)制作、網(wǎng)站建設(shè), 我們的網(wǎng)頁(yè)設(shè)計(jì)師為您提供的解決方案。

不懂用python如何構(gòu)建知識(shí)圖譜?其實(shí)想解決這個(gè)問(wèn)題也不難,下面讓小編帶著大家一起學(xué)習(xí)怎么去解決,希望大家閱讀完這篇文章后大所收獲。

知識(shí)圖譜可以用python構(gòu)建嗎?

答案當(dāng)然是可以的?。?!

那么如何使用python構(gòu)建

什么是知識(shí)圖譜

從Google搜索,到聊天機(jī)器人、金融風(fēng)控、物聯(lián)網(wǎng)場(chǎng)景、智能醫(yī)療、自適應(yīng)教育、推薦系統(tǒng),無(wú)一不跟知識(shí)圖譜相關(guān)。它在技術(shù)領(lǐng)域的熱度也在逐年上升。
互聯(lián)網(wǎng)的終極形態(tài)是萬(wàn)物的互聯(lián),而搜索的終極目標(biāo)是對(duì)萬(wàn)物的直接搜索。傳統(tǒng)搜索引擎依靠網(wǎng)頁(yè)之間的超鏈接實(shí)現(xiàn)網(wǎng)頁(yè)的搜索,而語(yǔ)義搜索是直接對(duì)事物進(jìn)行搜索,如人物、機(jī)構(gòu)、地點(diǎn)等。這些事物可能來(lái)自文本、圖片、視頻、音頻、IoT設(shè)備等各種信息資源。而知識(shí)圖譜和語(yǔ)義技術(shù)提供了關(guān)于這些事物的分類(lèi)、屬性和關(guān)系的描述,使得搜索引擎可以直接對(duì)事物進(jìn)行索引和搜索。
知識(shí)圖譜是由Google公司在2012年提出來(lái)的一個(gè)新的概念。從學(xué)術(shù)的角度,我們可以對(duì)知識(shí)圖譜給一個(gè)這樣的定義:“知識(shí)圖譜本質(zhì)上是語(yǔ)義網(wǎng)絡(luò)(Semantic Network)的知識(shí)庫(kù)”。但這有點(diǎn)抽象,所以換個(gè)角度,從實(shí)際應(yīng)用的角度出發(fā)其實(shí)可以簡(jiǎn)單地把知識(shí)圖譜理解成多關(guān)系圖(Multi-relational Graph)。
那什么叫多關(guān)系圖呢? 學(xué)過(guò)數(shù)據(jù)結(jié)構(gòu)的都應(yīng)該知道什么是圖(Graph)。圖是由節(jié)點(diǎn)(Vertex)和邊(Edge)來(lái)構(gòu)成,但這些圖通常只包含一種類(lèi)型的節(jié)點(diǎn)和邊。但相反,多關(guān)系圖一般包含多種類(lèi)型的節(jié)點(diǎn)和多種類(lèi)型的邊。
本項(xiàng)目利用pandas將excel中數(shù)據(jù)抽取,以三元組形式加載到neo4j數(shù)據(jù)庫(kù)中構(gòu)建相關(guān)知識(shí)圖譜。

運(yùn)行環(huán)境

基于Neo4j能夠很容易構(gòu)建知識(shí)圖譜,除了用neo4j自帶的cypher,也支持Python包py2neo創(chuàng)建節(jié)點(diǎn)和關(guān)系從而構(gòu)建知識(shí)圖譜。本項(xiàng)目是基于發(fā)票信息,將發(fā)票數(shù)據(jù)中結(jié)構(gòu)化數(shù)據(jù)抽象成三元組,分別創(chuàng)建節(jié)點(diǎn)和關(guān)系從而構(gòu)建成知識(shí)圖譜。
具體包依賴可以參考文件requirements.txt

neo4j-driver==1.6.2numpy==1.15.3pandas==0.23.4parso==0.3.1pickleshare==0.7.5pluggy==0.8.0prompt-toolkit==1.0.15py==1.7.0py2neo==3Pygments==2.2.0pytest==3.9.3python-dateutil==2.7.5wcwidth==0.1.7wincertstore==0.2xlrd==1.1.0

將所需依賴安裝到pyton中:pip install -r requirements.txt

Pandas抽取excel數(shù)據(jù)

python中pandas非常適用于數(shù)據(jù)分析與處理,可以將excel文件轉(zhuǎn)換成dataframe格式,這種格式類(lèi)似于Spark中的Dataframe結(jié)構(gòu),可以用類(lèi)sql的形式對(duì)數(shù)據(jù)進(jìn)行處理。
Excel數(shù)據(jù)結(jié)構(gòu)如下

用python如何構(gòu)建知識(shí)圖譜

通過(guò)函數(shù)data_extraction和函數(shù)relation_extrantion分別抽取構(gòu)建知識(shí)圖譜所需要的節(jié)點(diǎn)數(shù)據(jù)以及聯(lián)系數(shù)據(jù),構(gòu)建三元組。
數(shù)據(jù)提取主要采用pandas將excel數(shù)據(jù)轉(zhuǎn)換成dataframe類(lèi)型
invoice_neo4j.py

用python如何構(gòu)建知識(shí)圖譜

建立知識(shí)圖譜所需節(jié)點(diǎn)和關(guān)系數(shù)據(jù)

DataToNeo4jClass.py

用python如何構(gòu)建知識(shí)圖譜

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享用python如何構(gòu)建知識(shí)圖譜內(nèi)容對(duì)大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道,遇到問(wèn)題就找創(chuàng)新互聯(lián),詳細(xì)的解決方法等著你來(lái)學(xué)習(xí)!

網(wǎng)頁(yè)標(biāo)題:用python如何構(gòu)建知識(shí)圖譜-創(chuàng)新互聯(lián)
文章來(lái)源:http://www.muchs.cn/article26/ihccg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作、做網(wǎng)站App設(shè)計(jì)、商城網(wǎng)站虛擬主機(jī)、軟件開(kāi)發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

微信小程序開(kāi)發(fā)