隨著業(yè)務(wù)和IT信息化的發(fā)展建設(shè),為確保基礎(chǔ)設(shè)施的全面監(jiān)控,企業(yè)積極采購了多樣化的監(jiān)控設(shè)施,這些設(shè)施廣泛覆蓋了操作系統(tǒng)、關(guān)鍵組件以及硬件等多個(gè)層面,從而初步完成了IT技術(shù)設(shè)施和運(yùn)維管理工具的建設(shè)。然而,隨著業(yè)務(wù)的迅速增長,現(xiàn)有的運(yùn)維設(shè)施和系統(tǒng)開始暴露出諸多挑戰(zhàn),資源分散,缺乏有效的統(tǒng)一規(guī)范化管理,導(dǎo)致監(jiān)控覆蓋不全,告警治理變得困難重重。此外,監(jiān)控配置成本高昂、效率低下,且團(tuán)隊(duì)協(xié)作難度增加,這些因素都使得企業(yè)難以迅速響應(yīng)業(yè)務(wù)的變化和需求。在這個(gè)背景下,建設(shè)一體化監(jiān)控平臺(tái)的訴求逐漸成為各個(gè)企業(yè)的監(jiān)控建設(shè)重心。
面對(duì)這些問題,某大型運(yùn)營商企業(yè)基于嘉為藍(lán)鯨監(jiān)控中心,啟動(dòng)了基礎(chǔ)設(shè)施運(yùn)維管理系統(tǒng)建設(shè)工程,通過重塑運(yùn)維體系,構(gòu)建統(tǒng)一的一體化監(jiān)控平臺(tái),全方位提升監(jiān)控管理水平,提升運(yùn)維管理效率,為IT系統(tǒng)的安全、持續(xù)、不間斷運(yùn)行提供有力的支撐。
01. 業(yè)務(wù)場(chǎng)景
該企業(yè)在多年的運(yùn)維監(jiān)控中,通過自行搭建Zabbix、Prometheus等開源監(jiān)控平臺(tái),自行實(shí)施了大量操作系統(tǒng)、組件服務(wù)的監(jiān)控,同時(shí)外采了硬件監(jiān)控產(chǎn)品補(bǔ)足硬件監(jiān)控能力。但隨著企業(yè)的發(fā)展,這種缺乏完整監(jiān)控體系的管理模式逐漸暴露出監(jiān)控缺乏監(jiān)管——覆蓋率低、沒有統(tǒng)一規(guī)范——策略配置混亂、各監(jiān)控系統(tǒng)混合部署——運(yùn)維管理復(fù)雜等問題。傳統(tǒng)的監(jiān)控管理模式越發(fā)難以推進(jìn),亟需建設(shè)統(tǒng)一的監(jiān)控平臺(tái)。
02. 分析痛點(diǎn)
該公司目前的監(jiān)控建設(shè)正處于煙囪工具式監(jiān)控建設(shè)階段,且各類監(jiān)控場(chǎng)景尚不完備。客戶期望在補(bǔ)足監(jiān)控能力的同時(shí),建立成熟的一體化監(jiān)控平臺(tái)。從各個(gè)運(yùn)維場(chǎng)景下看,企業(yè)目前具備以下痛點(diǎn):
03. 解決方案
1)操作系統(tǒng)監(jiān)控 —— 基于藍(lán)鯨Agent的指標(biāo)采集
嘉為藍(lán)鯨監(jiān)控中心以藍(lán)鯨Agent為核心,內(nèi)置操作系統(tǒng)采集插件,只要部署了藍(lán)鯨Agent,就會(huì)自動(dòng)采集操作系統(tǒng)相關(guān)指標(biāo)數(shù)據(jù),無需手動(dòng)配置。通過One Agent的方式,該公司實(shí)現(xiàn)內(nèi)部操作系統(tǒng)的統(tǒng)一監(jiān)控、采集。
2)組件監(jiān)控 —— 強(qiáng)大的采集擴(kuò)展能力,積累豐富
監(jiān)控中心采用Agent+Plugins的設(shè)計(jì)模式,支持通過系統(tǒng)腳本、SQL語句、Exporter、Datadog插件等模式快速擴(kuò)展各類監(jiān)控對(duì)象的監(jiān)控,解決Agent模式下各類組件對(duì)象的監(jiān)控?cái)?shù)據(jù)采集問題。
同時(shí)監(jiān)控中心支持通過協(xié)議/接口(支持SNMP、IPMI、JMX、SQL、BK-Pull等)模式進(jìn)行擴(kuò)展,遠(yuǎn)程收集數(shù)據(jù),解決了各種無代理場(chǎng)景下的組件監(jiān)控問題。
基于上述模式,監(jiān)控中心同時(shí)還積累內(nèi)置了大量標(biāo)準(zhǔn)化插件,覆蓋絕大部分主流數(shù)據(jù)庫、中間件。同時(shí)具備成熟的指標(biāo)體系建設(shè),提供最佳實(shí)踐配置模板,引導(dǎo)用戶進(jìn)行監(jiān)控檢測(cè)。
3)容器監(jiān)控 —— 覆蓋容器資源、容器服務(wù)指標(biāo),全方位監(jiān)控
基于K8s原生的Prometheus監(jiān)控方案優(yōu)化改造,該公司實(shí)現(xiàn)以下場(chǎng)景的容器監(jiān)控:
支持對(duì)容器內(nèi)各類資源對(duì)象進(jìn)行發(fā)現(xiàn),并采集相關(guān)性能指標(biāo),包括Cluster、Workload、Pod、Container、Node
支持容器上部署的組件服務(wù)監(jiān)控,可通過以下方式進(jìn)行數(shù)據(jù)采集:
- 支持serviceMonitor(主推)和podMonitor
- sidecar 方式( 以sidecar模式部署exporter抓取器暴露出metrics,結(jié)合serviceMonitor進(jìn)行采集)
- 中心遠(yuǎn)程統(tǒng)一采集 (組件本身暴露了/metrics,結(jié)合serviceMonitor進(jìn)行采集)
4)統(tǒng)一監(jiān)控 —— 第三方監(jiān)控源數(shù)據(jù)接入,建立一體化監(jiān)控平臺(tái)
該公司通過嘉為藍(lán)鯨監(jiān)控系統(tǒng),實(shí)現(xiàn)第三方監(jiān)控?cái)?shù)據(jù)接入,通過開發(fā)監(jiān)控源插件進(jìn)行對(duì)接,抓取或接收其他監(jiān)控系統(tǒng)數(shù)據(jù)。如果對(duì)數(shù)據(jù)進(jìn)行一定的數(shù)據(jù)結(jié)構(gòu)清洗,還可將接入數(shù)據(jù)與藍(lán)鯨CMDB實(shí)例進(jìn)行關(guān)聯(lián),從而在指標(biāo)管理、數(shù)據(jù)檢測(cè)、可視化等能力上與嘉為藍(lán)鯨監(jiān)控中心自采集數(shù)據(jù)完全持平,建設(shè)真正的一體化監(jiān)控平臺(tái)。
04. 成果展示
1)操作系統(tǒng)監(jiān)控 —— 基于藍(lán)鯨Agent的指標(biāo)采集
2)組件監(jiān)控 —— 企業(yè)內(nèi)核心數(shù)據(jù)庫、中間件監(jiān)控接入,策略配置
3)容器監(jiān)控 —— K8s容器管理平臺(tái)監(jiān)控接入
4)統(tǒng)一監(jiān)控 —— 第三方監(jiān)控源數(shù)據(jù)接入,建立一體化監(jiān)控平臺(tái)
05. 建設(shè)成效
06. 場(chǎng)景適用性
嘉為藍(lán)鯨監(jiān)控中心目前已在各個(gè)運(yùn)維分層場(chǎng)景中,具備了完整的監(jiān)控方案和最佳實(shí)踐引導(dǎo),可以幫助企業(yè)盡可能多地完成監(jiān)控覆蓋;同時(shí)提供成熟的監(jiān)控?cái)?shù)據(jù)集成方案,既能與第三方監(jiān)控系統(tǒng)進(jìn)行數(shù)據(jù)對(duì)接,也能在數(shù)據(jù)處理、存儲(chǔ)、可視化等層面提供完全一致的能力與體驗(yàn)。適用于以下類型的企業(yè):
LLMOps+DeepSeek:大模型升級(jí)一體化運(yùn)維
查看詳細(xì)
DeepSeek賦能企業(yè)研發(fā):DevOps+AI 新時(shí)代再升級(jí)!
查看詳細(xì)
DeepSeek已接入!OpsPilot探索智能運(yùn)維無限可能!
查看詳細(xì)
SRE轉(zhuǎn)型:銀行 SRE 進(jìn)階之路
查看詳細(xì)
SRE轉(zhuǎn)型:銀行 SRE 轉(zhuǎn)型與 SLO 管理的深度融合
查看詳細(xì)
SRE轉(zhuǎn)型:不同團(tuán)隊(duì)規(guī)模下的銀行SRE團(tuán)隊(duì)組建策略
查看詳細(xì)
申請(qǐng)演示
主站蜘蛛池模板: 客服| 鸡西市| 常熟市| 加查县| 柳江县| 武川县| 镇康县| 仲巴县| 昆山市| 清流县| 都江堰市| 集贤县| 乐昌市| 洞口县| 武胜县| 潞西市| 民县| 北辰区| 宜川县| 铁岭市| 攀枝花市| 平安县| 沁源县| 滁州市| 沂源县| 合川市| 加查县| 民丰县| 高陵县| 武宁县| 东港市| 运城市| 彝良县| 密山市| 云梦县| 普格县| 萍乡市| 湘潭市| 辰溪县| 老河口市| 大石桥市|