本篇文章給大家分享的是有關(guān)如何用一行Python進(jìn)行數(shù)據(jù)收集探索,小編覺(jué)得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說(shuō),跟著小編一起來(lái)看看吧。
創(chuàng)新互聯(lián)網(wǎng)站建設(shè)由有經(jīng)驗(yàn)的網(wǎng)站設(shè)計(jì)師、開(kāi)發(fā)人員和項(xiàng)目經(jīng)理組成的專業(yè)建站團(tuán)隊(duì),負(fù)責(zé)網(wǎng)站視覺(jué)設(shè)計(jì)、用戶體驗(yàn)優(yōu)化、交互設(shè)計(jì)和前端開(kāi)發(fā)等方面的工作,以確保網(wǎng)站外觀精美、成都網(wǎng)站設(shè)計(jì)、網(wǎng)站制作易于使用并且具有良好的響應(yīng)性。簡(jiǎn)易的Pandas之路
任何使用Python數(shù)據(jù)的人都會(huì)熟悉Pandas包。Pandas是大多數(shù)行和列格式數(shù)據(jù)的go-to包。如果你沒(méi)有Pandas,請(qǐng)確保在終端中使用pip install安裝:
pip install pandas
現(xiàn)在,讓我們看看Pandas包中的默認(rèn)方法可以做些什么:
以下內(nèi)容寫給不知道上面發(fā)生了什么的新手:
任何Pandas數(shù)據(jù)幀都有一個(gè).descripe()返回上面的輸出的方法。但是,此方法中沒(méi)有注意到分類變量。在上面的示例中,輸出中完全省略了“ method ”列。
讓我們看看能不能解決這個(gè)問(wèn)題。
Pandas分析
如果我告訴你僅用3行Python就可以產(chǎn)生以下統(tǒng)計(jì)信息,你會(huì)怎么想?但其實(shí),如果不計(jì)算imports的話,總體上只用1行就夠。
要點(diǎn):類型,唯一值,缺失值
分位數(shù)統(tǒng)計(jì)信息:例如最小值,Q1,中位數(shù),Q3,大值,范圍,四分位數(shù)范圍
描述性統(tǒng)計(jì)數(shù)據(jù):例如平均值,眾數(shù),標(biāo)準(zhǔn)偏差,總和,中位數(shù)絕對(duì)偏差,變異系數(shù),峰度,偏度
常用值
直方圖
高相關(guān)變量Spearman,Pearson和Kendall矩陣的相關(guān)性突出顯示
缺失值矩陣,計(jì)數(shù),熱圖和缺失值樹(shù)狀圖
(功能列表直接來(lái)自Pandas Profiling GitHub)
好吧,我們可以使用Pandas Profiling軟件包!要安裝Pandas Profiling軟件包,只需在終端中使用pip install即可:
pip install pandas_profiling
經(jīng)驗(yàn)豐富的數(shù)據(jù)分析人員可能會(huì)因?yàn)檫@些數(shù)據(jù)的松散甚至乍一看之下的“華而不實(shí)”而嗤之以鼻,但這對(duì)于快速獲得數(shù)據(jù)的第一手印象肯定是有用的:
我們首先看到的是概述,其中提供了關(guān)于數(shù)據(jù)和變量的一些非常高級(jí)的統(tǒng)計(jì)信息,以及變量之間的高相關(guān)性、高偏態(tài)性的警告等。
但這還不算什么。向下滾動(dòng)我們會(huì)發(fā)現(xiàn)報(bào)告有多個(gè)部分,如果只是簡(jiǎn)單地用圖片展示這個(gè)1行程序的輸出是不足以完全呈現(xiàn)這些內(nèi)容的,所以我制作了一個(gè)gif:
我強(qiáng)烈建議大家自己去探索一下這個(gè)包的特性,畢竟,這里提到的只是一行代碼,在將來(lái) 的數(shù)據(jù)分析中,這個(gè)包可能會(huì)對(duì)你非常有用。
import pandas as pd import pandas_profiling pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/planets.csv').profile_report()
以上就是如何用一行Python進(jìn)行數(shù)據(jù)收集探索,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見(jiàn)到或用到的。希望你能通過(guò)這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道。
當(dāng)前題目:如何用一行Python進(jìn)行數(shù)據(jù)收集探索-創(chuàng)新互聯(lián)
瀏覽路徑:http://muchs.cn/article46/ioieg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)公司、面包屑導(dǎo)航、品牌網(wǎng)站制作、關(guān)鍵詞優(yōu)化、域名注冊(cè)、ChatGPT
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容