R語言入門及描述性統(tǒng)計分析的方法是什么

本篇文章給大家分享的是有關(guān)R語言入門及描述性統(tǒng)計分析的方法是什么,小編覺得挺實用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

站在用戶的角度思考問題,與客戶深入溝通,找到右江網(wǎng)站設(shè)計與右江網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗,讓設(shè)計與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網(wǎng)站設(shè)計、網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、申請域名、虛擬主機(jī)、企業(yè)郵箱。業(yè)務(wù)覆蓋右江地區(qū)。

今天要給大家講講R語言,主要是入門基礎(chǔ)及簡單的統(tǒng)計分析入門。

R語言其實算是我正式接觸編程語言的第一門語言,大學(xué)學(xué)的C++,matlab簡直是水到家了。所以剛開始學(xué)R語言的時候,我很痛苦,你知道嗎。大約經(jīng)歷了1個月的磨合期,逐漸對R有了點認(rèn)識,知道怎么去學(xué)了,都有哪些東西,當(dāng)然最開始還是找度娘,看什么書,怎么安裝等等之類的abc的問題。和大多數(shù)人學(xué)習(xí)的入門書籍一樣,我也是從《R語言實戰(zhàn)》這本書開始的,但是現(xiàn)在看來,我覺得這本書,只需要看前7章的內(nèi)容就可以了,因為后面的是涉及到具體模型的內(nèi)容,如果你沒有一個具體的實際問題去解決的話,學(xué)了也作用不大,畢竟我們不是為了考試。好了,先扯這么多,下面進(jìn)入正題。

# 如何使用R

## 安裝

Windows

下載地址: 

https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/

Windows的安裝比較簡單了,.exe文件,基本都是next就ok了。

需要說的是,有時候我們需要使用某個package的時候,R報錯說不支持當(dāng)前R版本,這時候,就需要安裝比較老的R版本,這里給一個舊版本的R鏈接,需要哪個版本的可以直接下。

https://cran.r-project.org/bin/windows/base/old/

還有一個問題,就是怎么更新R,現(xiàn)在R的最新版本是3.4.1.那么當(dāng)下一個版本出來的時候,怎么更新呢。最笨的辦法就是下載新版本,然后把舊版本卸載了。但是當(dāng)你使用了一段時間R以后,必然會安裝很多個packages,R安裝包并不大,但是加上packages的話,總共就很大了,我記得我最多的時候,安裝了好幾百個packages。這里要教大家一招是,在卸載R之前,把R安裝目錄中的library文件夾先復(fù)制出來另存,然后安裝完新版本的R以后,在把其中的文件復(fù)制到新安裝的library文件夾下面。一般在windows中,R的安裝目錄默認(rèn)為:

C:\ProgramFiles\R\R-3.4.0\library

然后是怎么在Ubuntu中安裝,也可以參考文檔:

https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/linux/ubuntu/README.html

依次執(zhí)行下面三條命令,就ok了。

sudo apt-get update

sudo apt-get install r-base

sudo apt-get install r-base-dev

然后,在Ubuntu中安裝完R之后,直接在shell里面輸入R,就會進(jìn)入到R環(huán)境中,但是這樣寫代碼是很累的,所以這里推薦大家使用Sublim Text 作為R的Ubuntu中的IDE。環(huán)境搭建也很簡單,主要是安裝SublimeREPL這個拓展包,在sublim中快捷鍵Ctrl+shift+P輸入install,會出來install package,然后輸入SublimeREPL就可以安裝了。安裝完了以后,在

Preferences > Package Settings >SublimeREPL > Settings-User

輸入以下內(nèi)容:

{

   "default_extend_env": {"PATH": "{PATH}; 這里寫你的安裝目錄"},

   "show_transferred_text": true

}

在windows在還有一個工具可以使用,就是R的IDE,相比于Python的IDE數(shù)量,比較好用的IDE也就是Rstudio了。,直接下載安裝就對了。

地址:https://www.rstudio.com/products/rstudio/download/

R語言入門及描述性統(tǒng)計分析的方法是什么

關(guān)于Rstudio的使用,我就想說一個問題,怎么設(shè)置R的編譯器。選擇

Tools—>Global options

可以選擇不同的R版本,尤其是對于安裝了不同版本的R用戶來說,就很關(guān)鍵。當(dāng)然如果你只安裝了一個版本的R,是不需要設(shè)置的,Rstudio在安裝的時候,會自動幫我們設(shè)置好。

R語言入門及描述性統(tǒng)計分析的方法是什么

好,其他的都可以先不用管,到這里環(huán)境就搭好了。

然后對于入門來說,基本的R概念,變量,數(shù)據(jù)結(jié)構(gòu)等今天就不展開講了,下面講幾種R中進(jìn)行描述性統(tǒng)計分析的方法。什么是描述性統(tǒng)計分析呢?簡單說就是根據(jù)樣本計算樣本統(tǒng)計量。比如均值,最大值,最小值,方差,分位數(shù),偏度,蜂度等。然后通過例子,你也可以大致了解一下,R語言的一些使用方法和特點。

R中單行注釋用#來表示,不支持多行注釋,如果要多行注釋,只能使用多個#。還有一個要說的是,Rstudio中多行注釋的快捷鍵是Ctrl+Shift+C,取消注釋也是Ctrl+Shift+C。關(guān)于快鍵鍵,強(qiáng)烈推薦大家自己去百度一下,把常用的記住,可以提高效率。

# 設(shè)置R工作目錄,setwd

setwd("F:/R_learn/")

# R語言的強(qiáng)大之處很重要的原因是R有很多packages,

# 這些Packages給我們提供了非常便利的工具。所以首先要

# 學(xué)會怎么安裝 packages,用下面這個命令,相當(dāng)于Python的pip install 。

install.packages("psych")

# 安裝好了以后,就需要加載進(jìn)來,相當(dāng)于Python的import。

library(psych)

# 讀取csv文件,R

test_data <-read.csv("da.csv", header = F, sep = ",")

# 查看數(shù)據(jù)類型

class(test_data)

# [1] "data.frame"

# 查看數(shù)據(jù)前5行

head(test_data)

# V1 V2 V3

# 1 25 26 27

# 2 36 37 38

# 3 47 48 49

# 4 58 59 60

# 5 69 70 71

# 6 80 81 82

# R中數(shù)據(jù)框的索引,使用美元符號,后面加列名。

col1 <- test_data$V1

# 描述性統(tǒng)計分析

summary(col1)

# Min. 1st Qu.  Median   Mean 3rd Qu.    Max.

# 25.00  44.25   63.50   63.50  82.75  102.00

summary(test_data)

# V1               V2               V3       

# Min.  : 25.00   Min.   : 26.00  Min.   : 27.00 

# 1st Qu.: 44.25   1st Qu.: 45.25   1st Qu.: 46.25 

# Median : 63.50   Median : 64.50   Median : 65.50 

# Mean  : 63.50   Mean   : 64.50  Mean   : 65.50 

# 3rd Qu.: 82.75   3rd Qu.: 83.75   3rd Qu.: 84.75 

# Max.  :102.00   Max.   :103.00  Max.   :104.00

# 然后我們使用psych包提供的另外一個函數(shù),看一下

describe(col1)

# vars n mean    sd median trimmed   mad min max range skew kurtosis   se

# 1   1 8 63.5 26.94   63.5    63.5 32.62 25 102    77    0   -1.65 9.53

describe(test_data)

# vars n mean    sd median trimmed   mad min max range skew kurtosis   se

# V1   1 8 63.5 26.94   63.5    63.5 32.62 25 102    77    0   -1.65 9.53

# V2   2 8 64.5 26.94   64.5    64.5 32.62 26 103    77    0   -1.65 9.53

# V3   3 8 65.5 26.94   65.5    65.5 32.62 27 104    77    0   -1.65 9.53

# 可以看到describe比summary多了幾個,trimmed表示截尾均值,skew表示偏# 度, kurtosis表示峰度,se表示標(biāo)準(zhǔn)誤差;

以上就是R語言入門及描述性統(tǒng)計分析的方法是什么,小編相信有部分知識點可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

分享文章:R語言入門及描述性統(tǒng)計分析的方法是什么
文章網(wǎng)址:http://muchs.cn/article44/gpjhhe.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站品牌網(wǎng)站設(shè)計、標(biāo)簽優(yōu)化、網(wǎng)站導(dǎo)航、網(wǎng)站改版、定制開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設(shè)