AIOps指多層技術平臺,這些平臺采用分析和機器學習技術分析從多種IT運營工具和設備收集的大數據,智能運維 aiops自動實時確定并應對問題,從而實現IT運營的自動化和增強。
Gartner預測,我們會看到當前的IT應用程序會發生劇變,而且我們管理整個IT生態系統的方式也會改變。這些變化的關鍵是Gartner所稱的AIOps平臺。
今天,ServiceHot為大家分享的是什么是AIOps,以及推動其發展的力量有哪些。
1、數字化轉型
了解數字化轉型如何引發Gartner的AIOps平臺出現非常重要。數字化轉型包含云計算的采用、快速變更和新技術的實施。它還要求將關注的重心轉向應用和開發人員,更快地開展創新和部署,并且贏得新的數字化用戶–機器代理、物聯網 (IOT) 設備、應用編程接口 (API) 等–而企業過去無需為這些用戶服務。所有這些新技術和用戶將傳統性能和服務管理戰略與工具推到了其能力極限。
Gartner采用AIOps一詞描述應對這些數字化轉型問題所需的IT運營描述變化。
2、什么是AIOps?
AIOps指多層技術平臺,這些平臺采用分析和機器學習技術分析從多種IT運營工具和設備收集的大數據,智能運維 aiops自動實時確定并應對問題,從而實現IT運營的自動化和增強。
簡單的說,AIOps就是指IT運營分析和管理(ITOA/ITOM)體系與大數據和人工智能技術結合的產物。
Gartner解釋了AIOps平臺如何采用圖1所示模式而運行。AIOps包含兩個主要組件:大數據和機器學習。它要求摒棄孤立的IT數據,以整合觀測數據(例如在監控系統和工作日志中發現的數據)和大數據平臺內部的交流數據(通常存在于工作單、事故和事件記錄中)。
然后,AIOps自動化運維針對匯總的IT數據實施一種綜合的分析和機器學習 (ML) 戰略。這樣做的預期成效是獲得持續的洞察力,進而采用自動化能力實現持續改進和修復。AIOps可視為核心IT功能的持續集成和部署 (CI/CD)。
3、AIOps業務價值描述
AIOps工具平臺是AI人工智能與傳統IT運營的融合,當AI的強大功能應用于IT數據中心運營管理時,它將徹底重新定義基礎架構管理方式。 比如:
>容量管理和規劃
>資源配置管理
>異常檢測
>風險監控與報警
>數據分析與預測
4、AIOPS發展趨勢
基于ServiceHot解決方案團隊經驗、訪談、觀察、思考和實踐得出的AIOps發展趨勢,即行業多樣化、產業生態化、數據多樣化、場景多樣化、場景精細化、算法服務化、技術平臺化、落地加速化、成熟度評估的標準化。
趨勢一:落地的多樣化。
多種渠道采集到的信息清楚表明:現在開始落地AIOps的,除了互聯網公司、銀行以外,證券、保險,電力、運營商、工業制造、國家機關、自動駕駛公司也都在嘗試AIOps落地。
趨勢二:產業生態化。
“產、學、研、用”各方也都在積極跟進,形成了一個AIOps生態系統。在這個生態系統里,專業的人負責專業的事,有越來越多的學術機構從事AIOps原理研究;由機構用戶負責提出實際需求,由有預研能力的廠商把AIOps原理上的突破變成實際落地效果;有負責數據采集、接入、存儲等的廠商,還有負責集成、交付、維保等的廠商。也就是說,“學、研、產、用”幾方專業分工,通力協作。AIOps產業生態化在AIOps落地過程中是一個重要的里程碑,會大力推動AIOps的更快落地。
趨勢三:數據多樣化。
數據中心的系統物理架構和軟件架構都非常龐大復雜。因此我們必須采集、治理、融合多種運維數據源、從中提取對運維最有用的信息,幫助我們了解數據中心最新最全的運行狀態, 從而為AIOps的眾多場景服務。因此我們說AIOps數據多樣化是必然趨勢。
趨勢四:是AIOps場景多樣化。
aiops幾個大場景:即異常發現、事件發現、事件分析、系統畫像、圖譜豐富等。每一個大場景會包含很多的具體場景,比如“事件分析”大場景就包括“異常機器定位”、“交易鏈條定位”、“多維度異常定位”等多種類型的事件分析。也就是說,當用戶認識到AIOps能實際幫助到運維的時候,會自發與生態系統中的伙伴共同找到越發多樣化的AIOps場景。
趨勢五:是AIOps場景精細化。
如下圖所示,異常檢測(也就是通過分析監控數據自動發現運維故障)就包含單指標異常檢測、多指標異常檢測、多維度異常檢測、日志異常檢測等等。而單指標異常檢測在檢測業務、機器、網絡、數據庫、存儲系統、批處理的異常時,其場景和檢測側重點會有所不同,因此需要針對精細化的具體場景進行AIOps異常檢測算法的適當調整或適配。
第六個趨勢就是AIOps算法服務化,提升了效率,讓整體服務得更好。
為了避免AIOps場景多樣化和精細化導致的落地工作量增加,我們必須把各類場景用到的AIOps算法共性部分抽象提煉出來作為公用模塊,為多個場景服務。如下圖所示,從日志數據測量出的指標數據的異常檢測,就可以復用單指標異常檢測這一算法模塊,并且這一算法模塊已經服務化,即可以通過API直接調用。
第七個趨勢,即AIOps自動化運維技術平臺化也就水到渠成了。
AIOps技術平臺化打穿多個場景、多個數據源、多個算法。如下圖所示,上面輸入的是各種運維監控數據,輸出的就是我們所需要的各種運維智能,中間是各種服務化的AIOps算法。不管具體的某個運維場景有什么樣的特點,我們都可以通過整體平臺進行自由組合和編排,從而高效落地該運維場景,避免傳統方法的重復低效落地。
趨勢八:AIOps新算法落地加速化。
以往一個新算法研制出來后,需要大量的工程工作配合才能讓新算法產生實際效果。有了平臺化之后,只需要通過編排把該新算法、新算法所需數據、已有工程工作“串”在一起,就能夠快速落地。比如做了一個0day攻擊檢測算法ZeroWall,我們在一家具體機構進行嘗試的時候,一周內捕獲28種0day攻擊,每天捕獲上萬條0day攻擊,每天誤報數0到6個。如果按照以往方法,我們要花大量的時間去做ZeroWall的落地工作,而有了AIOps平臺化, ZeroWall的落地工作就快了很多。
趨勢九:AIOps和超自動化。
超自動化被Gartner引用為2021年的領先技術趨勢之一,它融合了機器人流程自動化(RPA),人工智能,機器學習,業務流程管理(BPM)和高級分析功能,以使進入的業務流程實現自動化。隨著大小企業加快其數字化轉型計劃,超級自動化已成為使人類智能與AI保持一致的一種手段-一種周期性的伙伴關系,這種協作可以看到由數據饋送的任務的自動化,從而幫助人類做出有意義的決策和提高生產力。
5、AIOps 自動化運維 與 ITSM
AIOps工具是運維人員不可缺少的工具,在IT服務管理體系中,充當運維和工程師的眼睛,他可以主動發現基礎架構和系統底層已經出現或者即將出現的問題,(避免在客戶投訴時才發現問題)從而使得運維管理更加主動。
在ServiceHot ITSM一體化IT服務運營管理解決方案中,您可以選購智能監控管理模塊,打通設備、服務臺、工程師之間的最后一公里,使得發現的問題都能及時傳到到相關負責人手上,并且確保在服務級別要求的時間內解決處理,確保IT服務的可用性、連續性,充分體現IT管理價值。