舉例說明數(shù)據(jù)分析思維

前兩天刷知乎的時候看到這樣的問題

目前創(chuàng)新互聯(lián)已為近1000家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁空間、網(wǎng)站改版維護、企業(yè)網(wǎng)站設(shè)計、邗江網(wǎng)站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。

“為什么我國人才流失如此嚴重?”

題主的疑問來自于×××的數(shù)據(jù):
舉例說明 數(shù)據(jù)分析思維

2014年出國人數(shù)為46萬,而回國人數(shù)僅為36.5萬。

兩者相除,得出“歸國率”僅為79%,而2015年僅有78%。

因此,題主得出結(jié)論:我國海外人才大量流失。


隨后,各路人馬紛紛跳出來,開始一本正經(jīng)地分析為什么中國人才流失這么嚴重。

問題是,這樣的數(shù)據(jù)解讀正確嗎?

用同一年內(nèi)的出國人數(shù)和歸國人,計算出來的所謂“歸國率”,真的有意義嗎?

如果這個數(shù)據(jù)本身就沒有意義,那么“分析”背后的“原因”,無疑是南轅北轍了。

——請先思考一分鐘——

2015年歸國的留學生,肯定在2014年甚至更早就出國了。

極少有學校會開設(shè)1月入學,12月畢業(yè)的Program。

所以,這里用同一年內(nèi)的回國人數(shù)和出國人數(shù)相除,算出來的所謂“歸國率”純粹是瞎幾把算。

一般國外本科是3-4年,美國的master是1.5-2年,英國及英聯(lián)邦是1-1.5年,PhD一般要5年。

由于查不到不同項目人數(shù)的比例,因此保守估計平均出國年份為2年。
舉例說明 數(shù)據(jù)分析思維

-

根據(jù)×××的數(shù)據(jù),2015年回國是40.9萬,往前推2年,2013年出國人數(shù)是41.4萬。

2915年歸國率 = 40.9/41.4 ≈ 99%,遠高于所謂的“78%”。

同理,2014年的歸國率是 91%,2013年甚至超過100%(可能是由于較多其他年份出國留學的學生在2013年集中回國,導致數(shù)據(jù)爆表)。

近幾年的歸國率均高達90%以上,因此“我國人才流失嚴重”顯然是不成立了。

所以說,以后數(shù)據(jù)分析之前應該先動動腦子,不要總想著搞個大新聞批判一番。


這個問題是解決了,那么還能挖出什么別的東西呢?

還可以觀測趨勢。

整理了從1949-2015年,每一年的出國留學和歸國人數(shù)。

加總后,得到歸國人數(shù)總計218萬,出國人數(shù)總計292萬(不含2014和2015年),從而得出回國率75%。

為什么總體只有75%?這和我們計算的2013-2015年的歸國率相差甚大。

首先做一個簡單推測:早年的歸國率低,因此整體歸國率被拖了后腿。

分別計算每年的歸國率(篇幅原因,取1980年開始):
舉例說明 數(shù)據(jù)分析思維
果然,從改革開放以來,大部分年份的歸國率是非常低的,算術(shù)平均數(shù)僅為63%。

因此得出結(jié)論:近年來,越來越多的留學生選擇回國。

那么,還能不能挖掘出別的東西?

在分析過程中,我發(fā)現(xiàn)了一個有趣的現(xiàn)象,如果只看2000年以后的數(shù)據(jù),2003-2008年出現(xiàn)了明顯的洼地。
舉例說明 數(shù)據(jù)分析思維
為了找出原因,特別是要規(guī)避計算方法帶來的錯誤,我計算了出國和歸國人數(shù)的逐年增長率(YoY Growth)。
舉例說明 數(shù)據(jù)分析思維
數(shù)據(jù)表明,2000-2002年出現(xiàn)了一波出國的高潮,隨后增長率迅速下降,甚至出現(xiàn)負增長,直到2008年以后才恢復到了20%+的增長率。

所以,2008年實際上是一個分水嶺,08年之后,出國留學變得更加熱門。

結(jié)合平時實際了解的出國人群的情況,我們可以做這樣一個假設(shè):2008年以前出國人群中,本科和博士比例更高,2008年以后則是碩士比例更高。

因此,2008年以前出國的學生,在國外停留的時間應該更長,我們不妨認為這個平均時間是3.5年,取整為4年。

重新計算歸國率后:
舉例說明 數(shù)據(jù)分析思維
結(jié)果,不僅2005-2007年的洼地沒有改變,還在2002年出現(xiàn)了一波高峰。

因為這里已經(jīng)排除了計算方法帶來的錯誤,因此需要去探究背后的動因。

但想要真正透徹地探究其中的原因,只能通過大規(guī)模調(diào)研的方式詢問當時的留學生,顯然不太現(xiàn)實。


在這里先開一波腦洞大致推測下原因:

  • 2001年,中國發(fā)生了幾件大事:申奧成功,WTO,APEC會議,因此鼓舞了一批留學生在2002年集中回國效力

  • 2004-2008年,國內(nèi)輿論風波逐漸興起,各路公知興風作浪,在2008年到達頂峰,這幾年的留學生更多選擇在留在國外;

  • 2008年,內(nèi)有雪災、地震、毒奶粉,外有分裂反華勢力,中國在內(nèi)交外困之下成功地舉辦奧運會,從此國內(nèi)輿論形式逐漸反轉(zhuǎn);加之全球性的金融危機,導致海外的機會減少,大批留學生又選擇回國發(fā)展。

如果這是一次正式的數(shù)據(jù)分析,我們可以利用調(diào)研結(jié)果進一步分析出留學生回國的驅(qū)動因素,進而預測未來幾年的歸國率。

綜上,數(shù)據(jù)分析首先要保證數(shù)據(jù)和方法的準確性,然后大膽假設(shè),小心求證。在不斷地論證中,會逐漸挖掘出有價值的新信息。

除此以外,這些數(shù)據(jù)還可以做別的嗎?

還可以匡算市場規(guī)模。

從2015年開始,每年出國留學的人數(shù)已經(jīng)超過了50萬。

算上出國留學有至少2-3年的準備期,那么留學產(chǎn)業(yè)每年的基礎(chǔ)人群高達150萬

由此可以大致分別估算留學考試輔導、留學咨詢/中介、國際學校的市場規(guī)模。

同理,每年歸國的留學生超過40萬,這些留學生都需要在國內(nèi)求職。

算上1-2年的準備期,由此可以大致估算求職輔導(針對留學生)的市場規(guī)模。


以上這些僅僅是最簡單最粗淺的分析。

在實際咨詢項目中,一般會首先通過多方渠道驗證數(shù)據(jù)的準確性,然后搭建模型進行深入地分析,當然同樣少不了反復驗證的程序,結(jié)合定性分析,得出最終的結(jié)論。

分享文章:舉例說明數(shù)據(jù)分析思維
文章源于:http://muchs.cn/article14/pidjde.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供手機網(wǎng)站建設(shè)域名注冊、自適應網(wǎng)站、面包屑導航、定制網(wǎng)站、用戶體驗

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)