百度系統(tǒng)部高級系統(tǒng)工程師李喆:終端設(shè)備質(zhì)量評價指標(biāo)

中國IDC圈訊,開放數(shù)據(jù)中心峰會(ODCC2020)在北京召開,峰會圍繞數(shù)據(jù)中心新基建為主題,有數(shù)據(jù)中心領(lǐng)域及相關(guān)行業(yè)的眾多專家與會。在9月16日智能監(jiān)控與管理分論壇上,百度系統(tǒng)部高級系統(tǒng)工程師李喆做了以《終端設(shè)備質(zhì)量評價指標(biāo)》為主題的精彩演講。

創(chuàng)新互聯(lián)長期為上1000家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為永平企業(yè)提供專業(yè)的成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計,永平網(wǎng)站改版等技術(shù)服務(wù)。擁有10多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

大家好!我來自百度系統(tǒng)部高級系統(tǒng)工程師李喆,做《終端設(shè)備質(zhì)量評價指標(biāo)》的分享。

一、為什么做這套評價指標(biāo)?目的和意義從哪出發(fā)的?

項目范圍包括:設(shè)備廠家、監(jiān)控廠家,最后到業(yè)主最上面的管理平臺。我們希望治理的是從數(shù)據(jù)源頭把終端設(shè)備數(shù)據(jù)質(zhì)量提高和管控起來。因為數(shù)據(jù)源頭的數(shù)據(jù)質(zhì)量從底到上,最終決定了我們業(yè)主的管理平臺的數(shù)據(jù)質(zhì)量。高層數(shù)據(jù)質(zhì)量、頂層軟件系統(tǒng)的數(shù)據(jù)質(zhì)量最終一定是來自于最底下數(shù)據(jù)源的終端設(shè)備,高層數(shù)據(jù)質(zhì)量不會好于底層數(shù)據(jù)源的設(shè)備。

因為我們管理平臺以后隨著對數(shù)據(jù)消費(fèi)深度的增加,比如AI控制、故障預(yù)測、預(yù)測性維護(hù)等等需求越來越多,AI控制需要對數(shù)據(jù)采集的密度是1秒鐘1個點,如果底層這個終端設(shè)備只能提供5秒鐘一個點位,對我AI控制和AI分析不是一個很好的數(shù)據(jù),我就可能不能用。還有故障預(yù)測、預(yù)測性維護(hù)都需要有穩(wěn)定的數(shù)據(jù)源,我們白皮書要規(guī)范它。

還有些數(shù)據(jù)源欠佳,采集電標(biāo)出現(xiàn)極大值、極小值的情況,要從底層消除臟數(shù)據(jù),把數(shù)據(jù)比較慢、比較錯、極值從底層消除掉。

另外,我們現(xiàn)在缺少一個質(zhì)量監(jiān)控評價標(biāo)準(zhǔn),現(xiàn)在大多數(shù)做系統(tǒng)集成、做設(shè)備監(jiān)控,像TCP、RTU等等把通信協(xié)議連通了問題就不大了,數(shù)據(jù)可以采集上來了就可以了,但是具體采集數(shù)據(jù)的好壞是沒有一套很好的評價指標(biāo)、體系,所以我們現(xiàn)在這個解調(diào)要輸出評價指標(biāo)的白皮書,建立這套評價標(biāo)準(zhǔn),比如數(shù)據(jù)源接口吞吐率怎樣、HMI指標(biāo)怎樣有詳細(xì)指標(biāo)。

現(xiàn)在我們的階段輸出了評價指標(biāo)的白皮書,后面會再去輸出具體的指標(biāo)標(biāo)準(zhǔn),比如像吞吐率希望250個點/秒、響應(yīng)時間是1秒內(nèi)完成、抖動控制在多少,后面會出具體數(shù)字指標(biāo)。出完具體數(shù)字指標(biāo)之后推出認(rèn)證服務(wù)制定測試方案,對終端廠家設(shè)備比如電量儀、對采集風(fēng)冷精密空調(diào)設(shè)備制定測試方案,最終出個認(rèn)證的設(shè)備,在甲方招投標(biāo)過程中就知道你的設(shè)備是經(jīng)過我們認(rèn)證的,我們就可以放心的放到我們數(shù)據(jù)中心里來,最終就是要搞認(rèn)證。

質(zhì)量評價內(nèi)容是圍繞監(jiān)控架構(gòu)進(jìn)行的,架構(gòu)里的每一項,從運(yùn)行工況、到采樣控制、到存儲器、計存器、CPU、HMI、對外接口,每項都有具體指標(biāo)、具體評價標(biāo)準(zhǔn)。比如:運(yùn)行工況,要知道溫濕度系統(tǒng);采樣到底每秒鐘采多少個點;響應(yīng)控制時間延時是多少,控制對我們來講也是非常重要的;采集控制之后需要把這個數(shù)據(jù)放到計存器;計存器內(nèi)部的刷新時間到底是1秒好還是要求3秒,都有具體指標(biāo);存儲器在監(jiān)控系統(tǒng)里有存儲一定歷史數(shù)據(jù),歷史數(shù)據(jù)到底要存幾個月,對歷史數(shù)據(jù)查詢歷史趨勢、歷史報表的時間,比如要查一個歷史報表希望它10秒內(nèi)顯示,有的廠家做到30秒對我們來講不是一個滿意的結(jié)果;存儲和計存之后數(shù)據(jù)放到CPU處理;處理之后放到HMI人機(jī)接口進(jìn)行展示;另外一塊是放在對外接口,我們會評價它的吞吐率、響應(yīng)時間等等。

評價內(nèi)容圍繞三點——監(jiān)控點、本機(jī)監(jiān)控、對外接口:監(jiān)控點是靜態(tài)信息,比如監(jiān)控風(fēng)冷精密空調(diào),會去看監(jiān)控點的完整性,你能提供給我的點位是不是完整、是不是能滿足我的業(yè)務(wù)需求;本機(jī)監(jiān)控,HMI響應(yīng)時間、刷新時間;對外接口的性能,后面會一個個給大家講。

——監(jiān)控點。監(jiān)控點是描述設(shè)備完備性的,比如需要監(jiān)控風(fēng)冷型精密空調(diào),就需要設(shè)備給我提供送風(fēng)溫度、回風(fēng)溫度、送風(fēng)濕度、回風(fēng)濕度,有的系統(tǒng)如果只通過了送風(fēng)溫度而沒提供回風(fēng)溫度,那我認(rèn)為這個設(shè)備提供的完備性不夠,我們會考察這些完備性信息,根據(jù)不同的系統(tǒng)有區(qū)分。還有讀寫屬性,風(fēng)冷精密空調(diào)有送風(fēng)溫度設(shè)定值、回風(fēng)溫度設(shè)定值,我們都會去評估這些設(shè)定值是不是可以寫、寫的性能怎樣。從設(shè)計來講,我們點位分成模擬量和狀態(tài)量,比如我采集高質(zhì)量電能分析儀,A廠家提供分辨率是0.1,B廠家提供的分辨率是0.2,肯定是0.1的這個分辨率更高,采集數(shù)據(jù)的精度也更高,模擬量需要有明確的分辨率和單位。狀態(tài)量比如UPS,每個狀態(tài)需要有個明確的定義,比如UPS里會有供電模式主路供電、旁路供電、電池供電是狀態(tài),需要對每個狀態(tài)值也要有明確定義,一般可以寫成“123456”,也可以寫成“”,這都是比較清晰可讀的,如果廠家不太友好有可能寫成“AABBCCDD”或者有井號、嘆號等等,可讀性比較差,所以從靜態(tài)指標(biāo)會有具體要求。

——本機(jī)監(jiān)控。計存器數(shù)據(jù)刷新時間是個特別重要的指標(biāo),它決定上層采集數(shù)據(jù)的密度。比如一個普通的電量儀能采集的間隔時間是8毫秒,另外一個能采集的數(shù)據(jù)刷新時間是1秒,那我就知道8毫秒能采集的數(shù)據(jù)更密更多,對上層AI的分析、對預(yù)測性維護(hù)能拿到的數(shù)據(jù)更加精細(xì)。另外,HMI考慮數(shù)據(jù)刷新時間、延遲時間,底層數(shù)據(jù)從傳感器讀上來一個溫度可能是26度,從最底層傳感器到監(jiān)控系統(tǒng)計存器,最終到HMI這個顯示時間,希望它控制在2秒以內(nèi),如果時間太長了說明你的監(jiān)控系統(tǒng)本身質(zhì)量是不好的。還有HMI切換時間,頁面切換時間越短越好,液冷監(jiān)控從1切換到2切換到3,這個頁面切換不可能等10秒、20秒。另外,還有歷史數(shù)據(jù)查詢時間,比如在HMI上查詢某個溫度的歷史趨勢,不希望超過10秒鐘才能看到我的歷史趨勢、歷史報表,所以我們對HMI也有整體要求;控制執(zhí)行時間分兩塊,對命令響應(yīng)時間到動作時間,從接收到一個命令,到這個命令真正執(zhí)行完畢,我們會考量這個時間是不是在可靠、有效的范圍內(nèi)。

給大家澄清一個概念,數(shù)據(jù)刷新時間和延遲時間是有些區(qū)別的,數(shù)據(jù)中心時間是指數(shù)據(jù)在計存器內(nèi)部刷新時間,延遲時間是指計存器到HMI的時間。舉個例子,我們常說網(wǎng)速比較慢,但并沒有說是因為你刷新時間長還是帶寬低導(dǎo)致的網(wǎng)速慢,常說的網(wǎng)速慢有可能是帶寬低導(dǎo)致的,后面我們會把所有概念給精確定義出來。

——對外接口。這個對外接口決定了我們設(shè)備監(jiān)控系統(tǒng)可靠性、穩(wěn)定性。大家看右下角那個圖,終端設(shè)備在計存器刷新時間是5秒,上層監(jiān)控系統(tǒng)哪怕采集間隔是1秒,但是每秒鐘采集的值都是一樣的,底層終端設(shè)備5秒鐘才會刷新一次,等于采集了5次沒有意義的值,所以需要把終端設(shè)備時間也增強(qiáng),否則上層監(jiān)控系統(tǒng)做得再好,意義也沒那么大。接口響應(yīng)時間是接到一個數(shù)據(jù)包去響應(yīng)這個時間要控制在若干個毫秒之內(nèi),這個我們都會去考量;包括響應(yīng)周期是讀取接口暴露所有監(jiān)控點所用時間,比如精密空調(diào)對外暴露了100多個點位,把這100多個點位全部讀一遍的時間控制在多少毫秒;包括數(shù)據(jù)吞吐率,我希望每秒鐘讀數(shù)字量能4000個,每秒鐘讀250個模擬量,讀寫都是一樣的,如果你的設(shè)備達(dá)不到這個指標(biāo),我們采購時就不會去考慮;包括數(shù)據(jù)穩(wěn)定性,一是響應(yīng)成功率,比如發(fā)100個包響應(yīng)的是94請求,那成功率是94%,我們要求的成功率是達(dá)到99.99%才會去選用,二是抖動性也是衡量穩(wěn)定性的重要指標(biāo),希望這個通信維持在“嗒嗒嗒”,如果抖動比較大的話有可能是“嗒嗒嗒-嗒”,通過標(biāo)準(zhǔn)差和極差數(shù)學(xué)方法測量來評價你的數(shù)據(jù)抖動。

——MTBF。我們對設(shè)備監(jiān)控的平均無故障時間應(yīng)該跟主設(shè)備是一樣的,主設(shè)備沒有故障,監(jiān)控設(shè)備也不應(yīng)該出現(xiàn)故障。比如UPSMTBF為383400小時,那UPS接口平均故障時間也應(yīng)該是383400小時,到時候我們會通過壓力測試方法來進(jìn)行壓測,通過我們開發(fā)測試工具來進(jìn)行壓測,看你是不是能在一個長期范圍內(nèi)都符合我們前面剛才所提到的那些指標(biāo)。

二、參編單位

白皮書由騰訊、中科發(fā)起,我和中國電信的同學(xué)都參與了,我們希望招募設(shè)備廠家和監(jiān)控廠家,共同制定數(shù)據(jù)中心指標(biāo)標(biāo)準(zhǔn),未來一起制定標(biāo)準(zhǔn),設(shè)立認(rèn)證服務(wù),這是共贏的場面。

謝謝大家!

網(wǎng)站欄目:百度系統(tǒng)部高級系統(tǒng)工程師李喆:終端設(shè)備質(zhì)量評價指標(biāo)
文章地址:http://muchs.cn/article22/cgphjc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、微信小程序、全網(wǎng)營銷推廣、App設(shè)計外貿(mào)網(wǎng)站建設(shè)、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)