最近嘉為藍鯨WeOps研發的五款數據庫監控插件在藍鯨S-mart市場(點擊跳轉)上架啦!為了確保監控插件的兼容性、穩定性和安全性,研發團隊做了大量的測試優化,甚至還用到了混沌工程。接下來,讓我們一起看看如何打造出高質量的監控插件吧!
S-mart市場是騰訊藍鯨推出的一款云原生應用市場,為用戶免費提供一些基于藍鯨開源平臺的云原生應用系統、運維腳本工具、以及一些實用插件。
說明:插件可在藍鯨監控平臺導入使用,藍鯨平臺版本不低于V6.1
01. 研發背景
藍鯨監控平臺兼容Prometheus Exporter、Datadog Agent等各種開源的監控采集插件,運維人員利用開源社區可以快捷地將各類IT對象納入監控。
但開源社區中的監控插件質量往往無法得到保證,主要體現在以下幾個方面:
穩定性:
一些監控插件沒有經過專業測試,在使用過程中出現運行崩潰、內存泄露、大量占用系統資源等問題,嚴重時甚至影響業務系統的正常運行;
兼容性:
監控插件通常是針對IT組件的固定版本,在其他版本上使用時可能出現采集不到數據或采集到錯誤數據的問題;
安全性:
當監控插件存在安全隱患或被植入了病毒代碼,將會造成無法估量的損失;
易用性:
大部分開源社區的監控插件是純英文,指標和介紹不易閱讀理解;同時也存在插件需要經過改造才能在藍鯨監控平臺上使用的情況。
為此,我們基于開源社區,經過十道嚴格的工序對監控插件進行篩選、測試、優化改造與驗證,制作成更適合藍鯨監控體系的五大數據庫監控插件,并免費回饋給藍鯨社區,讓運維人員的工作更加輕松和高效。
02. 制作工序
1)挑選經過大眾檢驗的插件
精選Prometheus社區官方建議的數據庫插件及其他開源數據庫插件。
2)精選拓展性好的插件
部分插件由于編寫語言不支持,無法在藍鯨正常采集的,需尋找替代插件并補全需要的指標(如MySQL router exporter)
3)搭建84個版本環境測試兼容性
使用Jenkins流水線在集群內部署容器,測試了84個不同模式或版本的數據庫使用情況,得到每個探針的版本兼容性數據。
4)甄選出重要的監控指標
只保留運維工作中需要關注的指標,避免信息過載。
5)使用Chaos混沌工程進行隨機破壞與壓力測試
通過Chaos混沌工程,模擬了探針在高負載,故障等復雜情況下的運行狀況,為探針的性能和穩定性提供保證。
6)隱藏敏感信息,改進探針的安全性
優化前:賬號密碼在后臺顯示
優化后:賬號密碼已隱藏
7)指標漢化
8)適配藍鯨監控平臺
優化前:導入插件存在各類異常報錯問題
優化后:導入插件即可直接使用
9)編寫使用文檔
優化前:開源的配置文件不能指導如何在藍鯨平臺配置
優化后:添加進行藍鯨采集的配置說明
10)封裝打包
優化前:需要配置腳本文件
優化后:一鍵導入
新的數據庫監控插件具有簡單易用、多樣化監控、實時監控、數據可視化、安全可靠等多種優勢,是企業實現數據庫監控的不二選擇。
03. 使用方法
以MySQL為例,首先進入S-mart市場MySQL監控插件產品詳情,點擊【立即下載】下載插件。
進入監控平臺,點擊【集成】板塊,點擊【導入】上傳監控插件。
按照步驟指引和內置的使用文檔完成配置。
04. 效果展示
上述工具及部署指南已上架藍鯨S-mart市場及Github,點擊下方鏈接進行查看/下載。詳細介紹請點擊底部閱讀原文可獲取插件說明文檔。
S-mart 市場:https://bk.tencent.com/s-mart/market?sys_type=2&user_type=2&best_type=1&page_size=12
Github:https://github.com/orgs/WeOps-Lab/repositories?type=all
05. 社區貢獻
作為騰訊藍鯨的一級合作伙伴,嘉為藍鯨7年來致力于共建藍鯨開源社區,在監控插件、腳本工具、應用系統等各板塊持續輸出內容,推動藍鯨社區的開源生態的發展和創新。歡迎大家下載使用,給我們提供寶貴的建議和反饋!
申請演示
主站蜘蛛池模板: 乐安县| 汝州市| 镇坪县| 绥阳县| 湟中县| 定南县| 盘山县| 仁寿县| 富平县| 汝阳县| 张家港市| 五指山市| 乐陵市| 侯马市| 贵州省| 峨山| 德安县| 阳高县| 合川市| 永平县| 瓦房店市| 福州市| 汝阳县| 丰台区| 女性| 得荣县| 安远县| 抚顺市| 遵义市| 繁峙县| 仙游县| 定陶县| 沈丘县| 天水市| 醴陵市| 简阳市| 罗定市| 定安县| 油尖旺区| 通辽市| 滦平县|