計(jì)算機(jī)中數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容

這篇文章主要介紹計(jì)算機(jī)中數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

創(chuàng)新互聯(lián)-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比望謨網(wǎng)站開(kāi)發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式望謨網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋望謨地區(qū)。費(fèi)用合理售后完善,10多年實(shí)體公司更值得信賴。

數(shù)據(jù)的預(yù)處理內(nèi)容:1、數(shù)據(jù)審核,可以分為準(zhǔn)確性審核、適用性審核、及時(shí)性審核和一致性審核四個(gè)方面;2、數(shù)據(jù)篩選,對(duì)審核過(guò)程中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正;3、數(shù)據(jù)排序,按照一定順序?qū)?shù)據(jù)進(jìn)行排列。

本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。

數(shù)據(jù)預(yù)處理(data preprocessing)是指在主要的處理以前對(duì)數(shù)據(jù)進(jìn)行的一些處理。如對(duì)大部分地球物理面積性觀測(cè)數(shù)據(jù)在進(jìn)行轉(zhuǎn)換或增強(qiáng)處理之前,首先將不規(guī)則分布的測(cè)網(wǎng)經(jīng)過(guò)插值轉(zhuǎn)換為規(guī)則網(wǎng)的處理,以利于計(jì)算機(jī)的運(yùn)算。另外,對(duì)于一些剖面測(cè)量數(shù)據(jù),如地震資料預(yù)處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等。

數(shù)據(jù)的預(yù)處理是指對(duì)所收集數(shù)據(jù)進(jìn)行分類或分組前所做的審核、篩選、排序等必要的處理。

預(yù)處理內(nèi)容

1、數(shù)據(jù)審核

從不同渠道取得的統(tǒng)計(jì)數(shù)據(jù),在審核的內(nèi)容和方法上有所不同。

對(duì)于原始數(shù)據(jù)應(yīng)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全。準(zhǔn)確性審核主要是包括兩個(gè)方面:一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。審核數(shù)據(jù)準(zhǔn)確性的方法主要有邏輯檢查和計(jì)算檢查。邏輯檢查主要是審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無(wú)相互矛盾的現(xiàn)象,此方法主要適合對(duì)定性(品質(zhì))數(shù)據(jù)的審核。計(jì)算檢查是檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無(wú)錯(cuò)誤,主要用于對(duì)定量(數(shù)值型)數(shù)據(jù)的審核。

對(duì)于通過(guò)其他渠道取得的二手資料,除了對(duì)其完整性和準(zhǔn)確性進(jìn)行審核外,還應(yīng)該著重審核數(shù)據(jù)的適用性和時(shí)效性。二手資料可以來(lái)自多種渠道,有些數(shù)據(jù)可能是為特定目的通過(guò)專門調(diào)查而獲得的,或者是已經(jīng)按照特定目的需要做了加工處理。對(duì)于使用者來(lái)說(shuō),首先應(yīng)該弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景資料,以便確定這些資料是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。此外,還要對(duì)數(shù)據(jù)的時(shí)效性進(jìn)行審核,對(duì)于有些時(shí)效性較強(qiáng)的問(wèn)題,如果取得的數(shù)據(jù)過(guò)于滯后,可能失去了研究的意義。一般來(lái)說(shuō),應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)。數(shù)據(jù)經(jīng)審核后,確認(rèn)適合于實(shí)際需要,才有必要做進(jìn)一步的加工整理。

數(shù)據(jù)審核的內(nèi)容主要包括以下四個(gè)方面:

  • 準(zhǔn)確性審核。主要是從數(shù)據(jù)的真實(shí)性與精確性角度檢查資料,其審核的重點(diǎn)是檢查調(diào)查過(guò)程中所發(fā)生的誤差。

  • 適用性審核。主要是根據(jù)數(shù)據(jù)的用途,檢查數(shù)據(jù)解釋說(shuō)明問(wèn)題的程度。具體包括數(shù)據(jù)與調(diào)查主題、與目標(biāo)總體的界定、與調(diào)查項(xiàng)目的解釋等是否匹配。

  • 及時(shí)性審核。主要是檢查數(shù)據(jù)是否按照規(guī)定時(shí)間報(bào)送,如未按規(guī)定時(shí)間報(bào)送,就需要檢查未及時(shí)報(bào)送的原因。

  • 一致性審核。主要是檢查數(shù)據(jù)在不同地區(qū)或國(guó)家、在不同的時(shí)間段是否具有可比性。

2、數(shù)據(jù)篩選

對(duì)審核過(guò)程中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正。調(diào)查結(jié)束后,當(dāng)數(shù)據(jù)發(fā)現(xiàn)的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),就需要對(duì)數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選包括兩方面的內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤地?cái)?shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來(lái),對(duì)不符合特定條件的數(shù)據(jù)予以剔除。數(shù)據(jù)的篩選在市場(chǎng)調(diào)查、經(jīng)濟(jì)分析、管理決策中是十分重要的。

3、數(shù)據(jù)排序

數(shù)據(jù)排序是按照一定順序?qū)?shù)據(jù)排列,以便于研究者通過(guò)瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索。除此之外,排序還有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),為重新歸類或分組等提供依據(jù)。在某些場(chǎng)合,排序本身就是分析的目的之一。排序可借助于計(jì)算機(jī)很容易的完成。

對(duì)于分類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,但習(xí)慣上升序使用得更為普遍,因?yàn)樯蚺c字母的自然排列相同;如果是漢字型數(shù)據(jù),排序方式有很多,比如按漢字的首位拼音字母排列,這與字母型數(shù)據(jù)的排序完全一樣,也可按筆畫排序,其中也有筆畫多少的升序降序之分。交替運(yùn)用不同方式排序,在漢字型數(shù)據(jù)的檢查糾錯(cuò)過(guò)程中十分有用。

對(duì)于數(shù)值型數(shù)據(jù),排序只有兩種,即遞增和遞減。排序后的數(shù)據(jù)也稱為順序統(tǒng)計(jì)量。

以上是“計(jì)算機(jī)中數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

網(wǎng)站名稱:計(jì)算機(jī)中數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容
分享鏈接:http://muchs.cn/article20/jpesjo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站商城網(wǎng)站、電子商務(wù)用戶體驗(yàn)、網(wǎng)站排名企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

微信小程序開(kāi)發(fā)