【聚看點(diǎn)】分布式數(shù)據(jù)中心節(jié)點(diǎn)多?看信服云托管云如何實(shí)現(xiàn)精細(xì)運(yùn)維
(資料圖片)
隨著用戶數(shù)據(jù)中心節(jié)點(diǎn)的增多,在管理數(shù)據(jù)中心上,網(wǎng)絡(luò)突然中斷、流量高并發(fā)、網(wǎng)絡(luò)配置異常、網(wǎng)口硬件異常等問題時(shí)有發(fā)生。依靠人工手動(dòng)進(jìn)行網(wǎng)絡(luò)質(zhì)量及故障分析,并根據(jù)經(jīng)驗(yàn)進(jìn)行故障處置的傳統(tǒng)運(yùn)維方式,無法全面覆蓋數(shù)據(jù)中心出現(xiàn)的問題。
為此,信服云托管云研發(fā)了網(wǎng)絡(luò)全鏈路質(zhì)量感知與分析系統(tǒng)。
該系統(tǒng)能夠綜合運(yùn)營(yíng)商、物理網(wǎng)絡(luò)、主機(jī)網(wǎng)絡(luò)、VPC網(wǎng)絡(luò)等多層網(wǎng)絡(luò)視角,為運(yùn)維使用者提供一套全鏈路網(wǎng)絡(luò)質(zhì)量感知及智能分析解決方案 ,有效提升告警質(zhì)量和告警后排障效率。
網(wǎng)絡(luò)鏈路主動(dòng)撥測(cè)
可以優(yōu)化監(jiān)測(cè)分析及可視結(jié)構(gòu),并基于上下游關(guān)聯(lián)告警自動(dòng)挖掘和聚合方法聚合縮減非必要的監(jiān)測(cè)告警,分鐘級(jí)發(fā)現(xiàn)網(wǎng)絡(luò)通斷及卡慢,在大量告警中快速定位到根因,為IaaS管理員快速梳理機(jī)房和各租戶的網(wǎng)絡(luò)連通性狀態(tài),為租戶快速梳理其虛擬機(jī)內(nèi)部的網(wǎng)絡(luò)狀態(tài)報(bào)告。
基于RTT時(shí)延動(dòng)態(tài)基線的風(fēng)險(xiǎn)預(yù)測(cè)
基于RTT時(shí)延動(dòng)態(tài)基線進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè),支持智能基線的自動(dòng)學(xué)習(xí),通過對(duì)正常狀態(tài)下指標(biāo)的歷史表現(xiàn),加以調(diào)整后作為基準(zhǔn)線,與以后同樣時(shí)段的實(shí)時(shí)指標(biāo)做對(duì)比,能根據(jù)歷史記錄自動(dòng)生成基線,并可按照業(yè)務(wù)周期潮汐變化規(guī)律,形成以日基線、周基線的數(shù)據(jù)對(duì)比,一旦實(shí)時(shí)數(shù)據(jù)大于基線比對(duì)的一定范圍,即生成告警事件,成功預(yù)測(cè)風(fēng)險(xiǎn)。
同時(shí),該系統(tǒng)還會(huì)不斷進(jìn)化,未來可以實(shí)現(xiàn)虛擬機(jī)內(nèi)部的應(yīng)用網(wǎng)絡(luò)質(zhì)量和平臺(tái)IaaS層的一體化聯(lián)動(dòng)多模態(tài)分析,實(shí)現(xiàn)更快的故障定界。
基于全量指標(biāo)構(gòu)建實(shí)體資源圖譜體系,IT運(yùn)維人員在排障時(shí),也可通過關(guān)聯(lián)分析在5分鐘內(nèi)定位到虛擬機(jī)內(nèi)部、外部故障根因和處置建議,且能利用知識(shí)圖譜直觀掌握平臺(tái)健康狀態(tài)和故障影響面大小。
在網(wǎng)絡(luò)資源配置推薦上,可以全面監(jiān)控虛擬網(wǎng)絡(luò)拓?fù)洹⑴渲?、流量、?shù)據(jù)面狀態(tài)等數(shù)據(jù),利用多種機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)準(zhǔn)確的數(shù)據(jù)面性能壓力估計(jì)?;跀?shù)據(jù)面性能壓力及網(wǎng)絡(luò)流量歷史趨勢(shì),關(guān)聯(lián)預(yù)測(cè)數(shù)據(jù)面性能極限出現(xiàn)時(shí)間點(diǎn)并推薦最優(yōu)數(shù)據(jù)面資源配置。
以上就是關(guān)于信服云托管云上網(wǎng)絡(luò)全鏈路質(zhì)量感知與分析系統(tǒng)的介紹,該系統(tǒng)可以幫助用戶降低網(wǎng)絡(luò)故障率,實(shí)現(xiàn)數(shù)據(jù)中心的省心運(yùn)維。
關(guān)鍵詞: 新聞資訊
相關(guān)新聞