數(shù)據(jù)挖掘的方法很多,實用易懂的就這一種

2021-01-31    分類: 網(wǎng)站建設(shè)

六人定律,相信大家一定都不會陌生。簡單的說,你只需要通過6個人,就可以認識到世界上所有的人。足以說明,世界就像一張網(wǎng),任何事物之間都能找到關(guān)系。

大數(shù)據(jù)時代,我們把這樣的網(wǎng)絡(luò)叫關(guān)系網(wǎng)絡(luò),那么,如何從關(guān)系網(wǎng)絡(luò)中挖掘出有價值的信息?以下為你一一道來。

什么是關(guān)系網(wǎng)絡(luò)

4、度和權(quán)重

點的“度”數(shù),是指與該點相連的邊的條數(shù)。對于有向圖,“度”也可以細分為出度和入度。與節(jié)點相連的邊越多,說明該點越重要,所以節(jié)點的“度”數(shù)反映了一個點的重要程度。

再說說點的權(quán)重,權(quán)重是表示點的重要程度的另一種方式。權(quán)重有很多種評價方式,可以用點的某項屬性度量值為權(quán)重,例如:注冊資本等。也可以用某種算法求出點的權(quán)重,例如:PageRank。

可以用度數(shù)或權(quán)重在”圖”中直觀表示節(jié)點的重要程度。下圖是《悲慘世界》人物關(guān)系,用PageRank為直徑表示不同人物的重要性,可以看到,Valjean是其中的核心人物(主角)。

5、中介中心性

中介中心性在我們WonderDM中又稱節(jié)點影響度。中介中心性指的是一個結(jié)點擔(dān)任其它兩個結(jié)點之間最短路徑的橋梁的次數(shù)。一個結(jié)點充當(dāng)“中介”的次數(shù)越高,它的中介中心度就越大。中介中心性是研究一個參與者在多大程度上居于其他兩個參與者之間,因而是一種"控制能力"指數(shù)。

下圖是《悲慘世界》人物關(guān)系,用中介中心性為直徑表示人物節(jié)點??梢钥吹?,F(xiàn)antine是其中的關(guān)鍵人物。

數(shù)據(jù)挖掘的方法很多,實用易懂的就這一種

6、模塊化

模塊化(Modularity)是關(guān)系網(wǎng)絡(luò)分析中用于分析網(wǎng)絡(luò)結(jié)構(gòu)的一種方法。根據(jù)一個群組內(nèi)部比群組外部具有更高密度的聯(lián)結(jié)的原則,它將網(wǎng)絡(luò)分成不同的群組,通常也叫群(groups)、族群(clusters)或者社群(communities)),通常用來偵測網(wǎng)絡(luò)的社群結(jié)構(gòu)。通俗的說,找出網(wǎng)絡(luò)由哪些小圈子組成。

以微博轉(zhuǎn)發(fā)數(shù)據(jù)形成的關(guān)系網(wǎng)絡(luò)為例,將此網(wǎng)絡(luò)模塊化之后按模塊進行分組配色,可以很鮮明的看到整個網(wǎng)絡(luò)形成了若干個不同的圈子,可以對圈子內(nèi)的個體詳細了解后,定位該圈子的群組特征。

數(shù)據(jù)挖掘的方法很多,實用易懂的就這一種

7、K-Core

一個圖的k-Core是指反復(fù)去除“度”小于k的節(jié)點后,所余下的子圖,所有的節(jié)點度數(shù)都為k。K-Core算法是簡化復(fù)雜網(wǎng)絡(luò)并得到核心子網(wǎng)絡(luò)的算法之一,其簡單有效可以運用到很多領(lǐng)域。K-Core可以幫助我們從復(fù)雜的關(guān)系網(wǎng)絡(luò)中提取高度相關(guān)的子結(jié)構(gòu)(如社區(qū)、團體、關(guān)聯(lián)企業(yè)等)。例如可以在采購欺詐模型中,幫助我們分析買家或賣家之間行為異常的團伙或找出整個交易網(wǎng)絡(luò)中處在核心位置的供應(yīng)商或采購商。

如下圖所示,使用K-Core算法,我們在一個復(fù)雜的關(guān)系網(wǎng)絡(luò)中,找到若干關(guān)聯(lián)度比較高的客戶群體。

數(shù)據(jù)挖掘的方法很多,實用易懂的就這一種

小結(jié)

現(xiàn)在是萬物互聯(lián)的時代,可謂萬物皆有關(guān)系,關(guān)系網(wǎng)絡(luò)分析可以應(yīng)用到幾乎所有社會活動當(dāng)中。利用關(guān)系網(wǎng)絡(luò)分析手段,結(jié)合時空數(shù)據(jù)、地理關(guān)系等建立可視化表征,可以揭示對象間的關(guān)聯(lián)和對象時空相關(guān)的模式及規(guī)律,億信華辰的數(shù)據(jù)挖掘產(chǎn)品WonderDM提供了涵蓋分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及時間序列等五大類、十余個小類的核心數(shù)據(jù)挖掘算法,同時支持擴展數(shù)據(jù)挖掘算法,讓用戶能夠快速找到與業(yè)務(wù)更為貼合的數(shù)據(jù)挖掘模型。可以廣泛應(yīng)用于金融、銀行、保險、物流、交通、安防、互聯(lián)網(wǎng)等各行各業(yè)。

網(wǎng)頁名稱:數(shù)據(jù)挖掘的方法很多,實用易懂的就這一種
鏈接URL:http://www.muchs.cn/news0/98350.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App設(shè)計、網(wǎng)站改版、虛擬主機、軟件開發(fā)營銷型網(wǎng)站建設(shè)、品牌網(wǎng)站設(shè)計

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)