普洱搪蒂电子技术有限公司

股票代碼:603516

七大標(biāo)準(zhǔn)判別分布式系統(tǒng)的優(yōu)劣(下)

2020-03-20

七看運(yùn)維管理

智能化的運(yùn)維管理就像人體的免疫系統(tǒng)一樣不可或缺,它可以圍繞業(yè)務(wù)系統(tǒng)進(jìn)行日常安全監(jiān)測,掌握系統(tǒng)的各項(xiàng)指標(biāo),并根據(jù)指標(biāo)作出“健康”與否的判斷;對檢測到的設(shè)備運(yùn)行不正常狀態(tài)或者設(shè)備故障發(fā)生預(yù)警,并及時(shí)通知運(yùn)維管理人員進(jìn)行維護(hù)。這種運(yùn)維方式側(cè)重于設(shè)備故障隱患和缺陷的早期發(fā)現(xiàn)和處理,提高了設(shè)備的穩(wěn)定性和可靠性。


專業(yè)的運(yùn)維管理解決方案涵蓋如下要點(diǎn):


1. 動態(tài)展示系統(tǒng)連接的拓?fù)鋱D

與分布式相關(guān)的周邊系統(tǒng),尤其是網(wǎng)絡(luò)系統(tǒng),都與最終畫面上屏的響應(yīng)速度、圖像質(zhì)量、操作延遲、拼接同步性等效果息息相關(guān)。分布式節(jié)點(diǎn)通過交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備連接,任何一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)故障、掉線,都會使得某路畫面黑屏,這時(shí)需要能夠及時(shí)定位到故障點(diǎn),才可以在最短時(shí)間內(nèi)解決網(wǎng)絡(luò)故障。

系統(tǒng)拓?fù)?gif

因此分布式系統(tǒng)的運(yùn)維管理軟件需要能提供一個(gè)動態(tài)變化的設(shè)備連接拓?fù)鋱D,通過拓?fù)鋱D直觀地看到分布式設(shè)備及周邊設(shè)備的在線狀態(tài)與故障狀態(tài),不用實(shí)際到現(xiàn)場排查,就可以反饋給用戶到底是哪個(gè)環(huán)節(jié)發(fā)生問題。

2. 圖形化查看設(shè)備詳細(xì)運(yùn)行指標(biāo)

除了設(shè)備的在線與否之外,為了更好的掌握系統(tǒng)運(yùn)行狀態(tài)與趨勢,設(shè)備的詳細(xì)運(yùn)行指標(biāo)也同樣關(guān)鍵,如各個(gè)分布式節(jié)點(diǎn)的輸入輸出分辨率、幀率、視頻傳輸速率等。與分布式設(shè)備連接的交換機(jī),也需要實(shí)時(shí)了解其運(yùn)行時(shí)間、溫度、CPU占用率、內(nèi)存占用率、某端口流量、抖動、丟包率等。
三維圖形化查看.gif
只有掌握了這些信息,才能在發(fā)生畫面抖動、卡頓、錯(cuò)位等“軟問題”時(shí),精準(zhǔn)定位到問題所在,降低分布式系統(tǒng)可能受到的外界環(huán)境干擾。

3. 具備故障告警與預(yù)警提示

傳統(tǒng)的運(yùn)維模式通常是被動式的,即用戶發(fā)現(xiàn)問題,再排查問題所在。而現(xiàn)代化的分布式運(yùn)維更應(yīng)該是主動式的,即系統(tǒng)一旦發(fā)生故障,分布式系統(tǒng)要能主動以頁面的彈窗、聲音或郵件、短信等渠道,為用戶做出告警提示,即使用戶不再指揮中心或會議室內(nèi),也能通過手機(jī)等方式遠(yuǎn)程掌握分布式系統(tǒng)的狀態(tài)。


告警.gif
另外,智能化的運(yùn)維管理應(yīng)不僅僅是發(fā)生問題、解決問題,更應(yīng)該利用大數(shù)據(jù)等手段,記錄系統(tǒng)運(yùn)行數(shù)據(jù),并對未來趨勢進(jìn)行預(yù)測,在設(shè)備可能發(fā)生某個(gè)問題之前,前置性的做出預(yù)警提示,真正提高分布式系統(tǒng)的穩(wěn)定性。

4. 建立完善并有記錄的運(yùn)維工作流程

擁有了設(shè)備的監(jiān)測與告警,用戶可以最短時(shí)間內(nèi)掌握系統(tǒng)故障點(diǎn),但如何解決這些故障,依舊是一個(gè)值得深究的問題。分布式系統(tǒng)具有無限的擴(kuò)展性與覆蓋度,往往部署在大地域中。管理分布式的運(yùn)維人員也常常不是一個(gè)人,而是上下級單位、各個(gè)機(jī)構(gòu)多人配合。

閉環(huán)處理2.gif

效率最高的運(yùn)維解決方案是多人分工配合,如管理員在指揮中心對整個(gè)分布式系統(tǒng)監(jiān)管,發(fā)現(xiàn)故障點(diǎn)后,遠(yuǎn)程指導(dǎo)操作員實(shí)際到現(xiàn)場處理,并可通過系統(tǒng)實(shí)時(shí)判斷問題是否解決。這就需要分布式系統(tǒng)提供一個(gè)科學(xué)的運(yùn)維工作流程,從發(fā)現(xiàn)問題、派工單下發(fā)、到現(xiàn)場解決與問題反饋,運(yùn)維人員只需按照標(biāo)準(zhǔn)化的運(yùn)維流程來操作,并在系統(tǒng)內(nèi)記錄相關(guān)工作信息,即可高效率的完成運(yùn)維管理工作。


5. 覆蓋系統(tǒng)級別的統(tǒng)計(jì)與分析

真正的分布式運(yùn)維管理是一門系統(tǒng)性的科學(xué)與工作,應(yīng)該做到“精細(xì)化運(yùn)維”。所謂“精細(xì)化運(yùn)維”,即不僅僅對設(shè)備運(yùn)行狀態(tài)進(jìn)行監(jiān)管,也要收集并記錄運(yùn)維工作流中的告警響應(yīng)時(shí)間、工單解決時(shí)間、故障處理時(shí)間等信息,同時(shí)通過數(shù)據(jù)的挖掘與關(guān)聯(lián),對各類設(shè)備的故障率、高風(fēng)險(xiǎn)參數(shù)、視頻質(zhì)量影響率等進(jìn)行分析,生成綜合性的多維度系統(tǒng)運(yùn)行報(bào)表,幫助用戶持續(xù)改善分布式系統(tǒng)的運(yùn)維管理工作與應(yīng)用方式。


3_1統(tǒng)計(jì)分析(1).png

沒有運(yùn)維管理的業(yè)務(wù)系統(tǒng)相當(dāng)于人體失去了免疫系統(tǒng),不僅無法預(yù)防系統(tǒng)風(fēng)險(xiǎn),而且系統(tǒng)的安全性、穩(wěn)定性完全不受保障……只有具備專業(yè)智能化運(yùn)維管理的分布式系統(tǒng),才是真正完整、可靠的分布式系統(tǒng)。



伊吾县| 余江县| 新建县| 冷水江市| 千阳县| 景泰县| 丰台区| 张家界市| 诸城市| 房山区| 福安市| 西乌珠穆沁旗| 遂昌县| 关岭| 清水县| 鄂伦春自治旗| 本溪市| 融水| 保德县| 临高县| 台中县| 托里县| 太仓市| 武城县| 布拖县| 孟津县| 邢台县| 航空| 苗栗县| 年辖:市辖区| 青州市| 乃东县| 潼南县| 大洼县| 黄浦区| 香河县| 新化县| 华阴市| 徐水县| 沾益县| 海原县|