數(shù)據(jù)挖掘:用可視化效果展現(xiàn)你的數(shù)據(jù)

本文作者星河里的章魚(yú)喵,文章通過(guò)介紹Visualization 即可視化,羅列了數(shù)據(jù)的展現(xiàn)方式。對(duì)于數(shù)據(jù)分析最困難的一部分就是數(shù)據(jù)的展示,解讀數(shù)據(jù)之間的關(guān)系,清晰有效的傳達(dá)并且溝通數(shù)據(jù)信息。

創(chuàng)新互聯(lián)長(zhǎng)期為1000+客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開(kāi)放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為大冶企業(yè)提供專業(yè)的成都做網(wǎng)站、成都網(wǎng)站建設(shè),大冶網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開(kāi)發(fā)。

對(duì)于數(shù)據(jù)挖掘,我們可以通過(guò)文中對(duì)數(shù)據(jù)可視化的案例找到分析數(shù)據(jù)、展現(xiàn)數(shù)據(jù)的方法和思路。

Data visualization 是一件很有趣的事情。最近在嘗試處理數(shù)據(jù),便順手翻了翻 visualization 的進(jìn)展,然后除了 IBM 大名鼎鼎的的many-eyes。

還有一個(gè)比較好有意思的網(wǎng)站是visualizing。Visualizing 跟 many-eyes 很像,都是社區(qū)形式的網(wǎng)站,用戶可以注冊(cè)然后上傳,而且網(wǎng)站還有積累下來(lái)的很多數(shù)據(jù)供用戶使用。

當(dāng)然我不是為了介紹這個(gè)網(wǎng)站才寫(xiě)這篇 post 的,寫(xiě) post 是一個(gè)記筆記的過(guò)程,如果我不能從中學(xué)到什么,就有點(diǎn)浪費(fèi)時(shí)間了。下面進(jìn)入正題,我嘗試總結(jié)一下 visualization 的時(shí)候的幾個(gè)可用的經(jīng)驗(yàn)。

應(yīng)該使用何種形式來(lái)表現(xiàn)數(shù)據(jù)

從 visualizing.org 的分類中提取出來(lái)的有用的形式包括(不過(guò)說(shuō)實(shí)話這樣分類并不是很好用)

1.Chart

2.Time series

3.Map

4.Flow

5.Matrix

6.Network

7.Hierarchy

8.Info-graphic

要可視化的數(shù)據(jù)可以分幾類(我想的不全面,歡迎補(bǔ)充,共同學(xué)習(xí))

有一系列對(duì)象,他們之間相互有關(guān)聯(lián)

寫(xiě)成A↔B粗體的拉丁字母表示一系列對(duì)象,比如一系列地點(diǎn)。

這種情況下因?yàn)橐故緮?shù)據(jù)之間相互關(guān)系,所以實(shí)質(zhì)上是一個(gè) network 圖,不過(guò)通過(guò)一些技巧可以把簡(jiǎn)單的 network 圖變成更好的形式。

方式一:使用轉(zhuǎn)換成 flow 圖。通過(guò)把對(duì)象列出兩遍來(lái)是的原本應(yīng)該是一個(gè)比較復(fù)雜難以看清的 network 變成了清晰易查找的 flow。

這類圖中我喜歡的一個(gè)是people moving 的 flow

這個(gè) flow 圖非常好的展示了從一個(gè)國(guó)家移民到另一個(gè)國(guó)家,上面的截圖就是人們移居(migrate,是移民么?)到加拿大的情況,可以看到中國(guó)(CH)移民到加拿大的還是比較多的。通過(guò)這樣的 flow,我們可以很容易很直觀的分析數(shù)據(jù)。

方式二:圈形的 network 圖。為什么要做出圈形呢?因?yàn)槿π慰梢允沟眠B線集中在圈內(nèi)部,而且可以減少數(shù)據(jù)交叉。通過(guò) interactive design,可以使得連線無(wú)交叉。比如這個(gè)Migrants moving money:

這個(gè)截圖是中國(guó)的僑款,也就是中國(guó)移民所寄回祖國(guó)中國(guó)的錢(qián)數(shù)??梢钥磁懦愀鄣貐^(qū),美國(guó)是的來(lái)源。

事實(shí)上這種方法與第一種本質(zhì)是相同的。

方式三:network 圖。通過(guò)點(diǎn)和連線來(lái)關(guān)聯(lián)。例子比如Attractions of Councils: WEF GAC interlink survey

但是這個(gè)圖實(shí)際上并不好。而且有時(shí)候,線條是可以去掉的,比如這個(gè)國(guó)際航班的可視化:

Click a nation to see all connected nations via flights. Click again to see arranged nations based on the distance. Double-click the background to reset.

截圖:

方式四:使用 table。不過(guò)為了更直觀,使用面積等方式來(lái)代表數(shù)據(jù)的大小。

比如 10 個(gè)人任意兩個(gè)人之間相互按照對(duì)對(duì)方的好感程度打分,為了展示任意兩個(gè)人 A 和 B 之間相互的好感程度,可以使用顏色柱來(lái)展示,選定一個(gè)作為兩個(gè)人好感程度相同,顏色柱之上的顏色表示 A 對(duì) B 的好感大于 B 對(duì) A 的好感,反之亦然。

這里有個(gè)council 之間的例子,截圖如下:

層級(jí)數(shù)據(jù),數(shù)據(jù)之間可以分成幾個(gè)層級(jí)關(guān)系

就是 Hierarchy 圖,不過(guò)有時(shí)候可以省掉連線。

文章標(biāo)題:數(shù)據(jù)挖掘:用可視化效果展現(xiàn)你的數(shù)據(jù)
文章路徑:http://muchs.cn/article22/cghgcc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、靜態(tài)網(wǎng)站定制網(wǎng)站、網(wǎng)站維護(hù)、品牌網(wǎng)站建設(shè)、搜索引擎優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化