智能運維管理系統(tǒng)解決方案
自動化運維管理架構(gòu),為系統(tǒng)提供全面可靠的監(jiān)管,最大程度降低故障時間造成的服務(wù)質(zhì)量下降和業(yè)務(wù)損失,建立一套監(jiān)測、響應(yīng)、分析、管理的監(jiān)管機制,有效提高業(yè)務(wù)系統(tǒng)的支撐能力。
智能運維管理系統(tǒng)解決方案優(yōu)勢
智能監(jiān)控,高效運維,讓企業(yè)洞悉IT管理情況。
智能運維管理系統(tǒng)模塊設(shè)計
智能運維管理系統(tǒng)數(shù)據(jù)價值鏈
提升運維數(shù)據(jù)的應(yīng)用價值,盤活數(shù)據(jù)資產(chǎn)
提高運維管理精細化和智能化水平
科技管理創(chuàng)新,提升IT服務(wù)價值
精準分析,未來IT發(fā)展決策支持
全層次、全管理域、全周期自動化運維管理,是智能運維基礎(chǔ)。
采集配置層:負責實時性能數(shù)據(jù)、告警數(shù)據(jù)的采集、解析、上傳,網(wǎng)元的統(tǒng)一操作配置;
應(yīng)用處理層:完成事件流處理、相關(guān)資源、性能等數(shù)據(jù)的處理并入庫;
業(yè)務(wù)視圖層:通過歸一化呈現(xiàn)方式,確保業(yè)務(wù)信息數(shù)據(jù)的快速呈現(xiàn)和管理。
數(shù)據(jù)獲取方式有:
監(jiān)控范圍,分業(yè)務(wù)監(jiān)控和設(shè)備監(jiān)控2大類:
設(shè)備監(jiān)控:主要監(jiān)控主機、網(wǎng)絡(luò)、數(shù)據(jù)庫、存儲、中間件等的基礎(chǔ)體系指標;
業(yè)務(wù)監(jiān)控:主要監(jiān)控業(yè)務(wù)可用性、業(yè)務(wù)流量、業(yè)務(wù)服務(wù)能力等;
日常監(jiān)控指標有:
主機:Ping、Ping丟包率、Ping時延、CPU占用率、內(nèi)存占用率、虛擬內(nèi)存占用率、分區(qū)占用率、采集登錄異常、采集數(shù)據(jù)異常、磁盤IO讀寫速度(非Windows主機)、磁盤IO繁忙度(非Windows主機)、登陸用戶數(shù)(非Windows主機)、系統(tǒng)總進程數(shù)(非Windows主機)、電源總狀態(tài)(Dell)、風扇轉(zhuǎn)速(Dell)、硬盤狀態(tài)(Dell)、總體溫度值(Dell)。
數(shù)據(jù)庫:MSSQL表空間大小、MSSQL連接數(shù)、MSSQL日志空間占用率、MSSQL鎖數(shù)量、MySQL表鎖數(shù)量、MySQL流量、MySQL吞吐率、Oracle表空間占用率、Oracle當前連接數(shù)、Sysbase表空間占用率、Sysbase當前連接數(shù) 網(wǎng)絡(luò):Ping、Ping丟包率、Ping時延、CPU占用率、內(nèi)存占用率、采集數(shù)據(jù)異常、端口流量、端口狀態(tài)變更監(jiān)控、開機時長。
中間件:JVM CPU占用率(JMX)、JVM live狀態(tài)線程總數(shù)(JMX)、JVM內(nèi)存堆占用率(JMX)、JVM內(nèi)存非堆占用率(JMX)。
應(yīng)用:采集數(shù)據(jù)異常、進程數(shù)量、進程占用CPU前N監(jiān)控、進程占用內(nèi)存量、連接/監(jiān)聽端口監(jiān)控、網(wǎng)頁登錄狀態(tài)監(jiān)控、文件修改時間跟主機時間之差、應(yīng)用端口檢測。
其他個性化監(jiān)控指標:根據(jù)客戶需求來定制。
設(shè)備監(jiān)控:
業(yè)務(wù)監(jiān)控:
告警管理:
自動巡檢:
統(tǒng)計分析:
設(shè)備資料管理:
系統(tǒng)拓撲:
機房資源管理效果圖:
基于大數(shù)據(jù)分析技術(shù)的智能化IT運維,預(yù)測式的挖掘用戶剛需,使營銷更精準。
居民生活時空分析:基于A口信令數(shù)據(jù)挖掘分析居民生活時空軌跡、社交關(guān)系、出行路線等。達到大數(shù)據(jù)處理實時化,用戶軌跡直觀化,廣告營銷精準化。
公安110系統(tǒng):基于基站位置信息,在GIS上及時呈現(xiàn)人員位置信息。
故障管理:跨業(yè)務(wù)領(lǐng)域的全面監(jiān)控,通過聲音、色彩、短信、郵件等方式通知用戶告警消息,為解決故障提供建議的解決辦法和案例。
應(yīng)用范圍:中國電信集團公司、廣東分公司、佛山分公司、西藏分公司、公安局、房管局等領(lǐng)域。
目前已經(jīng)應(yīng)用到廣東電信、集團電信的網(wǎng)管中,涉及電信移動、接入、交換、數(shù)據(jù)、業(yè)務(wù)平臺、傳輸6個專業(yè),納入管控的設(shè)備將近12W臺(其中包括10W個左右的WIFI-AP) ,約500多個業(yè)務(wù)系統(tǒng)。審計49億3千萬次操作,發(fā)現(xiàn)IPTV、短信等9個平臺/系統(tǒng)共3101148次攻擊;500多個賬號出現(xiàn)11類違規(guī)使用問題近30萬次;敏感信息不合規(guī)訪問3000多次。
可監(jiān)控的設(shè)備廠家:
隨著數(shù)據(jù)量的龐大,實時數(shù)據(jù)的價值也將逐步降低,需要不斷的將歷史數(shù)據(jù)歸檔管理,為后續(xù)的關(guān)聯(lián)性分析提供更有效的依據(jù)價值。