01. 何為自動(dòng)化運(yùn)維&普通運(yùn)維?
在了解兩者的區(qū)別前,我們得先明確對(duì)二者的定義,總的來說運(yùn)維工作的目的都是為了保障企業(yè)業(yè)務(wù)連續(xù)性,核心在于提供高效、高質(zhì)量、安全的IT運(yùn)維服務(wù)。
大部分人對(duì)“普通運(yùn)維”的認(rèn)知應(yīng)該是指IT的傳統(tǒng)運(yùn)維模式,大量依靠人工的手段去維護(hù)企業(yè)基礎(chǔ)設(shè)施和應(yīng)用運(yùn)行穩(wěn)定,基本都包括日常維護(hù)、監(jiān)控保障、變更發(fā)布、資源管理、運(yùn)維流程、服務(wù)支持等內(nèi)容。至于“自動(dòng)化”這一詞,隨著現(xiàn)代控制理論和電子計(jì)算機(jī)的出現(xiàn),更多的是指將自動(dòng)控制和信息處理相結(jié)合,使得機(jī)器設(shè)備、系統(tǒng)或過程在沒有人或較少人的直接參與下,按照人的要求,經(jīng)過自動(dòng)檢測(cè)、信息處理、分析判斷和操作控制來實(shí)現(xiàn)預(yù)期的目標(biāo)的過程。
放到自動(dòng)化運(yùn)維的維度,更多的是針對(duì)特定的運(yùn)維場(chǎng)景,將運(yùn)維一線人員長(zhǎng)期做的一些周期性、重復(fù)性的工作抽離出來,借助自動(dòng)化工具或平臺(tái)來替代或協(xié)助完成運(yùn)維工作,提升運(yùn)維效率降低系統(tǒng)風(fēng)險(xiǎn),促進(jìn)運(yùn)維組織的成熟和能力的升級(jí)。
“普通運(yùn)維”和自動(dòng)化運(yùn)維并不存在嚴(yán)格的邊界劃分,自動(dòng)化運(yùn)維是普通傳統(tǒng)運(yùn)維演進(jìn)的一種更高階狀態(tài)。至于為何企業(yè)運(yùn)維部門會(huì)大力投入資源做運(yùn)維的自動(dòng)化升級(jí),根源在于圍繞運(yùn)維的三個(gè)核心(效率、質(zhì)量、安全),原來的傳統(tǒng)運(yùn)維方式都存在著對(duì)應(yīng)的問題:
就筆者近幾年在各個(gè)行業(yè)內(nèi)的調(diào)研和實(shí)踐情況來看,企業(yè)IT部門的數(shù)字化水平和運(yùn)維部門的工具能力建設(shè)都難以支撐或無法完全替代傳統(tǒng)運(yùn)維的全部工作,要實(shí)現(xiàn)真正意義上的完全自動(dòng)化運(yùn)維還存在包括運(yùn)維技術(shù)和理念、企業(yè)內(nèi)部管理制度和工作規(guī)范等等的約束,但傳統(tǒng)運(yùn)維方式向自動(dòng)化逐步演進(jìn)的趨勢(shì)是可以預(yù)見的。
02. 企業(yè)從傳統(tǒng)普通運(yùn)維向自動(dòng)化運(yùn)維升級(jí)能否一步到位?
2016年互聯(lián)網(wǎng)行業(yè)開始進(jìn)入所謂下半場(chǎng),各種“數(shù)字經(jīng)濟(jì)”“云原生”“大數(shù)據(jù)”“AI”等概念層次不窮,傳統(tǒng)行業(yè)特別是金融、能源、政府單位等也開始卷入數(shù)字化轉(zhuǎn)型的大潮,從業(yè)務(wù)端數(shù)字化最先開始也即轉(zhuǎn)向O2O、云計(jì)算到傳統(tǒng)開發(fā)架構(gòu)轉(zhuǎn)向云原生,最終運(yùn)維也隨之主動(dòng)或被迫迎來屬于自己的數(shù)字化轉(zhuǎn)型。
其中自動(dòng)化運(yùn)維就是數(shù)字化轉(zhuǎn)型中很熱門的話題之一,在2017-2020年間是各企業(yè)/單位紛紛上馬各類自動(dòng)化運(yùn)維項(xiàng)目最為活躍的時(shí)期。但在落地后的一段時(shí)間漸漸會(huì)發(fā)現(xiàn)還是存在種種的問題,比如各工具相對(duì)獨(dú)立無法實(shí)現(xiàn)聯(lián)動(dòng),工具擴(kuò)展性能差,開源工具漏洞無人維護(hù),IT的配置數(shù)據(jù)不準(zhǔn)確等,原本的目的是希望借助自動(dòng)化工具能提升運(yùn)維的效率,沒想到在某種程度上反而成為制約運(yùn)維效率提升的原因之一。
近兩年來這些企業(yè)又開始返工,回來重新修煉“基本功”。在筆者看來要實(shí)現(xiàn)從普通運(yùn)維向自動(dòng)化運(yùn)維的升級(jí),必須先做好以下幾方面的基本功,否則自動(dòng)化運(yùn)維只會(huì)曇花一現(xiàn),無法持續(xù)的支撐運(yùn)維工作,更談不上提升運(yùn)維工作的效率和保障業(yè)務(wù)的數(shù)字化轉(zhuǎn)型。那么企業(yè)要實(shí)現(xiàn)自動(dòng)化運(yùn)維之前要做好哪些鋪墊呢?
筆者認(rèn)為運(yùn)維的數(shù)字化轉(zhuǎn)型依次遵循“對(duì)象數(shù)字化”、“行為數(shù)字化”、“運(yùn)營(yíng)數(shù)字化” 的方式是目前最佳的演進(jìn)路徑。具體來說,建議企業(yè)在對(duì)運(yùn)維進(jìn)行數(shù)字化轉(zhuǎn)型或運(yùn)維升級(jí)的過程中,首先將CMDB作為企業(yè)IT架構(gòu)進(jìn)行數(shù)字化描述的基礎(chǔ),只有實(shí)現(xiàn)IT架構(gòu)中每一個(gè)對(duì)象的數(shù)字化,才能實(shí)現(xiàn)其狀態(tài)的數(shù)字化,從而實(shí)現(xiàn)其可觀測(cè)性,進(jìn)而通過操作和服務(wù)行為的數(shù)字化,實(shí)現(xiàn)不同場(chǎng)景下的運(yùn)維自動(dòng)化來保障業(yè)務(wù)的連續(xù)性和敏捷性。在此基礎(chǔ)上才有可能實(shí)現(xiàn)運(yùn)維的終極目標(biāo)——構(gòu)建企業(yè)級(jí)的技術(shù)運(yùn)營(yíng)體系,全面支撐企業(yè)數(shù)字化實(shí)現(xiàn)成功。
值得一提的是,并非要求所有企業(yè)一定嚴(yán)格按照以上的路徑來提升自己的運(yùn)維水平,建議企業(yè)可以根據(jù)自身的實(shí)際情況在統(tǒng)一的運(yùn)維平臺(tái)之上進(jìn)行建設(shè),一方面對(duì)于已有的工具可以盡量整合充分利舊,另一方面對(duì)于缺失的能力進(jìn)行補(bǔ)足和加強(qiáng)。
03. 那么企業(yè)如何真正的落地自動(dòng)化運(yùn)維呢?
如果我們企業(yè)在前期已經(jīng)有了相對(duì)扎實(shí)的基礎(chǔ),比如有比較完善的配置管理系統(tǒng)、監(jiān)控告警體系和運(yùn)維流程管理平臺(tái)再來考慮自動(dòng)化運(yùn)維的建設(shè)會(huì)更加合理,避免出現(xiàn)返工或重復(fù)建設(shè)的情況,落地的效果和產(chǎn)生的收益也會(huì)更顯著。筆者認(rèn)為落地自動(dòng)化運(yùn)維要分為以下幾個(gè)步驟:
1)評(píng)估企業(yè)所處的運(yùn)維發(fā)展階段
企業(yè)可組織梳理現(xiàn)在內(nèi)部的運(yùn)維工具特別是自動(dòng)化工具的建設(shè)情況,是否具備腳本/命令批量執(zhí)行、文件下發(fā)和數(shù)據(jù)采集能力,是否具備作業(yè)執(zhí)行包括定時(shí)、API調(diào)用和作業(yè)編排的能力,是否擁有跨區(qū)域的平臺(tái)底座,評(píng)估現(xiàn)有人員的配置情況和能力。最簡(jiǎn)單的方式見下圖判斷企業(yè)目前處于自動(dòng)化運(yùn)維成熟度的哪一階段?
2)打造統(tǒng)一的自動(dòng)化運(yùn)維平臺(tái)
組織一個(gè)團(tuán)隊(duì)負(fù)責(zé)自動(dòng)化基礎(chǔ)平臺(tái)的建設(shè),IT各個(gè)部門和組織根據(jù)需求自行在平臺(tái)上開發(fā)SaaS工具。既要求發(fā)揮多方的積極性,又可以形成很好的合力,兼顧個(gè)性化需求和團(tuán)隊(duì)共性。這就對(duì)平臺(tái)本身的建設(shè)提出極高挑戰(zhàn),要求能夠提供統(tǒng)一架構(gòu)、統(tǒng)一認(rèn)證、統(tǒng)一調(diào)用、統(tǒng)一接入等能力,實(shí)現(xiàn)自動(dòng)化工具的敏捷和快速迭代。
這意味著自動(dòng)化運(yùn)維平臺(tái)的能力層(PaaS)需要將原有的運(yùn)維能力進(jìn)行拆分,將公用的能力沉淀下來形成各個(gè)原子比如有管控平臺(tái)、作業(yè)平臺(tái)、標(biāo)準(zhǔn)運(yùn)維等,有統(tǒng)一接入的接口API Gateway能對(duì)接外部的系統(tǒng)和第三方工具(iPaaS),同時(shí)具備基于PaaS的開發(fā)框架針對(duì)不同的運(yùn)維場(chǎng)景去做運(yùn)維工具的開發(fā)(aPaaS)。正是基于運(yùn)維平臺(tái)開發(fā)的所有自動(dòng)化工具才能在平臺(tái)上能實(shí)現(xiàn)天然的交互聯(lián)動(dòng),形成真正統(tǒng)一的自動(dòng)化運(yùn)維平臺(tái)。
3)梳理企業(yè)現(xiàn)有的運(yùn)維流程
絕大部分的運(yùn)維流程都會(huì)同時(shí)涉及到各類操作執(zhí)行流和審批流,因此有必要提前梳理清楚各類運(yùn)維流程,比如在金融行業(yè)都會(huì)有非常嚴(yán)格的運(yùn)維流程要求,一般都會(huì)參照像ITIL、ISO20000、ITSS等的標(biāo)準(zhǔn)去建設(shè)。對(duì)于已完善的流程要梳理哪些環(huán)節(jié)可以通過自動(dòng)化手段代替或協(xié)助完成,保證涉及的流程節(jié)點(diǎn)盡量實(shí)現(xiàn)線上化、自動(dòng)化、標(biāo)準(zhǔn)化,以此提高整個(gè)流程的效率。
4)在運(yùn)維平臺(tái)上持續(xù)構(gòu)建自動(dòng)化運(yùn)維場(chǎng)景
通過OASR(對(duì)象-場(chǎng)景-工具-人員)模型具體分析運(yùn)維場(chǎng)景,首先明確針對(duì)的是哪些運(yùn)維對(duì)象、應(yīng)用系統(tǒng)和基礎(chǔ)架構(gòu);其次梳理現(xiàn)有運(yùn)維的組織架構(gòu)中人員的構(gòu)成,針對(duì)這些運(yùn)維對(duì)象可以使用哪些運(yùn)維工具;最后我們對(duì)運(yùn)維操作進(jìn)行編排和執(zhí)行,形成自動(dòng)化運(yùn)維的場(chǎng)景。按這類方法梳理出來的場(chǎng)景會(huì)有很多,在這里我們核心解決日常運(yùn)維任務(wù)、應(yīng)用發(fā)布、災(zāi)備切換、資源交付等自動(dòng)化場(chǎng)景。
04. 嘉為藍(lán)鯨提供的自動(dòng)化運(yùn)維解決方案
針對(duì)不同的運(yùn)維場(chǎng)景,嘉為藍(lán)鯨提供一系列自動(dòng)化運(yùn)維解決方案,自動(dòng)化運(yùn)維提升的關(guān)鍵在于IT對(duì)象執(zhí)行能力的整合和場(chǎng)景構(gòu)建。為實(shí)現(xiàn)ITOM融合的體系自動(dòng)化并全面覆蓋運(yùn)維工作,需在執(zhí)行能力整合達(dá)到運(yùn)維能力原子化的基礎(chǔ)上完成跨IT對(duì)象的執(zhí)行編排調(diào)度,從單對(duì)象的自動(dòng)化突破到發(fā)布、災(zāi)切、應(yīng)用巡檢等復(fù)合場(chǎng)景的構(gòu)建。
限于篇幅的原因,在這里筆者提供三個(gè)常見的自動(dòng)化運(yùn)維場(chǎng)景(應(yīng)用發(fā)布自動(dòng)化、災(zāi)備切換自動(dòng)化、巡檢自動(dòng)化)供題主參考,后續(xù)其他自動(dòng)化場(chǎng)景可持續(xù)擴(kuò)展。
1)應(yīng)用發(fā)布自動(dòng)化
背景:應(yīng)用架構(gòu)不斷更新,用戶需求激增,應(yīng)用數(shù)量成倍增長(zhǎng),發(fā)布迭代的速度越來越快。應(yīng)用運(yùn)維確保應(yīng)用穩(wěn)定運(yùn)行,還需同時(shí)響應(yīng)研發(fā)、業(yè)務(wù)訴求,完成版本變更或上線交付,提供相關(guān)服務(wù)給到業(yè)務(wù)、運(yùn)營(yíng)和測(cè)試等外部人員。 產(chǎn)品能力:嘉為藍(lán)鯨應(yīng)用發(fā)布中心支持單體、SOA、微服務(wù)、容器化應(yīng)用的發(fā)布與管理;支持程序包、配置文件及其實(shí)例化、SQL包、模板集(K8s YAML文件)的發(fā)布;支持多應(yīng)用、多實(shí)例、多環(huán)境、多集群發(fā)布;支持定時(shí)、并行、滾動(dòng)、分批發(fā)布、藍(lán)綠發(fā)布、灰度發(fā)布等方式;可快速發(fā)布或回滾,具備靈活的可視化編排引擎。幫助企業(yè)高效、快速、規(guī)范、穩(wěn)定地實(shí)現(xiàn)自動(dòng)化部署。
2)災(zāi)備切換自動(dòng)化
背景:企業(yè)對(duì)業(yè)務(wù)中斷的容忍度不斷降低,業(yè)務(wù)架構(gòu)復(fù)雜度提升,切換流程也越來越復(fù)雜。企業(yè)能否順利完成災(zāi)備切換,取決于災(zāi)備系統(tǒng)的建設(shè),災(zāi)備演練是否充分以及災(zāi)備切換步驟是否準(zhǔn)確到位。同時(shí)企業(yè)需要通過實(shí)際的災(zāi)備切換演練來不斷地優(yōu)化改進(jìn)災(zāi)備預(yù)案。
產(chǎn)品能力:嘉為藍(lán)鯨災(zāi)備切換自動(dòng)化提供靈活的流程編排能力,幫助企業(yè)實(shí)現(xiàn)應(yīng)用災(zāi)備切換及恢復(fù)的預(yù)案管理和操作自動(dòng)化,支持一鍵災(zāi)備切換和大屏跟蹤展示,能夠保證企業(yè)定期災(zāi)備切換活動(dòng)的成功進(jìn)行,同時(shí)助力企業(yè)數(shù)字化轉(zhuǎn)型。
3)應(yīng)用巡檢自動(dòng)化
背景:自動(dòng)化巡檢是對(duì)網(wǎng)絡(luò)、服務(wù)器、服務(wù)/應(yīng)用的巡檢手動(dòng)操作轉(zhuǎn)變成自動(dòng)化的形式。通常巡檢工作面臨如下幾個(gè)場(chǎng)景的問題:
產(chǎn)品能力:嘉為藍(lán)鯨自動(dòng)化巡檢中心改變運(yùn)維人員傳統(tǒng)重復(fù)手動(dòng)巡檢的工作方式,支持用戶自定義巡檢腳本和巡檢對(duì)象,覆蓋即時(shí)性、周期性等巡檢場(chǎng)景,根據(jù)任務(wù)計(jì)劃實(shí)現(xiàn)自動(dòng)化巡檢并生成標(biāo)準(zhǔn)可視化報(bào)告,減少巡檢工作量并提高巡檢有效性,助力運(yùn)維人員輕松全面掌握IT對(duì)象運(yùn)行狀態(tài)及潛在風(fēng)險(xiǎn)。
LLMOps+DeepSeek:大模型升級(jí)一體化運(yùn)維
查看詳細(xì)
DeepSeek賦能企業(yè)研發(fā):DevOps+AI 新時(shí)代再升級(jí)!
查看詳細(xì)
DeepSeek已接入!OpsPilot探索智能運(yùn)維無限可能!
查看詳細(xì)
SRE轉(zhuǎn)型:銀行 SRE 進(jìn)階之路
查看詳細(xì)
SRE轉(zhuǎn)型:銀行 SRE 轉(zhuǎn)型與 SLO 管理的深度融合
查看詳細(xì)
SRE轉(zhuǎn)型:不同團(tuán)隊(duì)規(guī)模下的銀行SRE團(tuán)隊(duì)組建策略
查看詳細(xì)
申請(qǐng)演示
主站蜘蛛池模板: 固阳县| 德钦县| 青海省| 潮安县| 蒙山县| 防城港市| 吉木乃县| 米泉市| 彭水| 延津县| 珠海市| 丹巴县| 灵川县| 乐至县| 交城县| 藁城市| 城固县| 溧阳市| 蓝田县| 乌兰浩特市| 潢川县| 淮安市| 修武县| 梁平县| 本溪| 五大连池市| 泽普县| 望江县| 乐山市| 阳谷县| 阳新县| 壶关县| 平顺县| 壤塘县| 桓仁| 都安| 水城县| 赤水市| 宜黄县| 济阳县| 太原市|