最近嘉為藍鯨WeOps研發的五款數據庫監控插件在藍鯨S-mart市場(點擊跳轉)上架啦!為了確保監控插件的兼容性、穩定性和安全性,研發團隊做了大量的測試優化,甚至還用到了混沌工程。接下來,讓我們一起看看如何打造出高質量的監控插件吧!
S-mart市場是騰訊藍鯨推出的一款云原生應用市場,為用戶免費提供一些基于藍鯨開源平臺的云原生應用系統、運維腳本工具、以及一些實用插件。
說明:插件可在藍鯨監控平臺導入使用,藍鯨平臺版本不低于V6.1
01. 研發背景
藍鯨監控平臺兼容Prometheus Exporter、Datadog Agent等各種開源的監控采集插件,運維人員利用開源社區可以快捷地將各類IT對象納入監控。
但開源社區中的監控插件質量往往無法得到保證,主要體現在以下幾個方面:
穩定性:
一些監控插件沒有經過專業測試,在使用過程中出現運行崩潰、內存泄露、大量占用系統資源等問題,嚴重時甚至影響業務系統的正常運行;
兼容性:
監控插件通常是針對IT組件的固定版本,在其他版本上使用時可能出現采集不到數據或采集到錯誤數據的問題;
安全性:
當監控插件存在安全隱患或被植入了病毒代碼,將會造成無法估量的損失;
易用性:
大部分開源社區的監控插件是純英文,指標和介紹不易閱讀理解;同時也存在插件需要經過改造才能在藍鯨監控平臺上使用的情況。
為此,我們基于開源社區,經過十道嚴格的工序對監控插件進行篩選、測試、優化改造與驗證,制作成更適合藍鯨監控體系的五大數據庫監控插件,并免費回饋給藍鯨社區,讓運維人員的工作更加輕松和高效。
02. 制作工序
1)挑選經過大眾檢驗的插件
精選Prometheus社區官方建議的數據庫插件及其他開源數據庫插件。
2)精選拓展性好的插件
部分插件由于編寫語言不支持,無法在藍鯨正常采集的,需尋找替代插件并補全需要的指標(如MySQL router exporter)
3)搭建84個版本環境測試兼容性
使用Jenkins流水線在集群內部署容器,測試了84個不同模式或版本的數據庫使用情況,得到每個探針的版本兼容性數據。
4)甄選出重要的監控指標
只保留運維工作中需要關注的指標,避免信息過載。
5)使用Chaos混沌工程進行隨機破壞與壓力測試
通過Chaos混沌工程,模擬了探針在高負載,故障等復雜情況下的運行狀況,為探針的性能和穩定性提供保證。
6)隱藏敏感信息,改進探針的安全性
優化前:賬號密碼在后臺顯示
優化后:賬號密碼已隱藏
7)指標漢化
8)適配藍鯨監控平臺
優化前:導入插件存在各類異常報錯問題
優化后:導入插件即可直接使用
9)編寫使用文檔
優化前:開源的配置文件不能指導如何在藍鯨平臺配置
優化后:添加進行藍鯨采集的配置說明
10)封裝打包
優化前:需要配置腳本文件
優化后:一鍵導入
新的數據庫監控插件具有簡單易用、多樣化監控、實時監控、數據可視化、安全可靠等多種優勢,是企業實現數據庫監控的不二選擇。
03. 使用方法
以MySQL為例,首先進入S-mart市場MySQL監控插件產品詳情,點擊【立即下載】下載插件。
進入監控平臺,點擊【集成】板塊,點擊【導入】上傳監控插件。
按照步驟指引和內置的使用文檔完成配置。
04. 效果展示
上述工具及部署指南已上架藍鯨S-mart市場及Github,點擊下方鏈接進行查看/下載。詳細介紹請點擊底部閱讀原文可獲取插件說明文檔。
S-mart 市場:https://bk.tencent.com/s-mart/market?sys_type=2&user_type=2&best_type=1&page_size=12
Github:https://github.com/orgs/WeOps-Lab/repositories?type=all
05. 社區貢獻
作為騰訊藍鯨的一級合作伙伴,嘉為藍鯨7年來致力于共建藍鯨開源社區,在監控插件、腳本工具、應用系統等各板塊持續輸出內容,推動藍鯨社區的開源生態的發展和創新。歡迎大家下載使用,給我們提供寶貴的建議和反饋!
申請演示
主站蜘蛛池模板: 淅川县| 灌阳县| 延庆县| 辽宁省| 安阳县| 兰西县| 鹿邑县| 新安县| 荆州市| 玛沁县| 绥阳县| 南岸区| 灌南县| 娄烦县| 驻马店市| 勐海县| 温州市| 临安市| 石泉县| 德昌县| 讷河市| 寿光市| 盐亭县| 碌曲县| 盐津县| 泰兴市| 教育| 张家港市| 准格尔旗| 陵水| 湄潭县| 伊吾县| 佛坪县| 金寨县| 日喀则市| 乃东县| 鸡东县| 洪江市| 巴彦县| 安丘市| 万载县|