來源:2025年度農村金融機構科技創新優秀案例評選
獲獎單位:安徽省農信社
榮獲獎項:運維管理創新優秀案例
一、項目背景及目標
在業務數字化轉型加速、技術持續創新的背景下,業界對運維管理的訴求與價值期望不斷提升,方法論體系也隨之迭代更新,從技術導向轉向業務價值導向。由此,運維模式需從傳統的穩態被動支撐,轉向敏捷迭代、主動運維和數據運營轉變。為響應中國人民銀行《金融科技發展規劃(2022-2025年)》及國家金融監督管理總局《關于促進銀行業保險業數字化轉型的指導意見》等政策要求,加速金融科技創新與IT運維數字化轉型,安徽省農信社啟動基于軟件工程的全棧綜合運維平臺建設。
綜合運維平臺將資源覆蓋、應用立體監控、多源告警對接、應用自動發布、自動化作業編排等工作能力應用到日常運維工作中,以實現運維集中管控、工具治理、數據治理以及運維開發拓展,并集成現有運維工具,構建“IaaS管控層-原子平臺層-PaaS應用層-運維場景層”四層架構,打造基礎平臺、配置管理平臺、作業平臺等核心模塊,形成“五大運維基礎能力”支撐“六大運維場景中心”的技術體系。
二、項目方案
![]()
本項目以“構建一體化、數智化運維體系,提升自主可控能力,護航金融科技業務安全穩定”核心目標,結合行業運維向“一體化、平臺化、數智化”演進趨勢與內部運維痛點,制定“統籌規劃、急用先行、一體化配套”實施策略,分階段推進項目落地。項目以“五大運維基礎能力”為支撐,構建“六大運維場景中心”,打造自主可控的技術運營中臺;通過“Server-Proxy-Agent”分布式架構部署基礎平臺,適配復雜網絡與信創環境,集成運維工具實現資源覆蓋、監控告警、自動發布等功能,同時引入低代碼開發平臺提高運維開發能力。
(一)基礎平臺
基礎平臺是底層管控系統,是上層運維服務體系與底層IaaS的連接器,為上層提供指令、文件、數據的通道,支持直連模式、代理模式以及最優連接指定級聯路由的模式。其以“穩定、安全、海量、可擴展”為核心特性,通過靈活的部署架構、全場景的功能覆蓋及強大的適配能力,為上層“六大運維場景核心”和“五大運維基礎能力”提供底層技術支撐,是實現運維一體化、平臺化、數智化的關鍵基石。
(二)配置管理平臺
配置管理平臺以“全資源納管、數據質量保障、支撐多場景消費”為核心目標,構建覆蓋硬件設備、服務器、數據庫、中間件、云資源、信創組件等全類型運維對象的配置管理體系。平臺通過自動發現、Excel導入、手動錄入等多種方式實現配置數據采集,主機納管率超95%,并覆蓋多種主流數據庫及Nginx、Tomcat、TongWeb等中間件模型。同時,建立數據質量治理機制,通過屬性完整性、關聯完整性、屬性規范性校驗保障數據準確性,輸出CMDB資源大屏實時展示業務數量、主機分配、操作系統占比等核心指標。此外,平臺還實現配置數據多場景消費,可關聯告警事件形成全鏈路閉環、支撐拓撲管理與容量分析,為監控中心、告警中心、自動化運維中心等上層模塊提供精準配置數據支撐,是實現運維一體化、數智化的關鍵數據底座。
(三)作業平臺
作業平臺是項目自動化運維能力落地的核心載體,作為“五大運維基礎能力”中自動化能力的核心支撐模塊,聚焦“標準化、自動化、可編排”目標,為全類型運維對象提供集中化作業管理服務。平臺支持網絡設備、服務器、數據庫、容器平臺、應用等多場景運維對象接入,具備腳本管理、作業編排、任務管理等核心功能,可落地自動化巡檢、災備演練、應急處置、基礎軟件部署等典型場景。同時,與CMDB、監控中心、應用發布中心深度協同,有效提升運維操作的安全可靠性與效率,減少人工操作負載與風險,是實現運維自動化轉型的關鍵工具平臺。
(四)公共組件
作為保障平臺安全訪問與有序協作的核心支撐,公共組件提供了統一用戶門戶、全場景用戶管理及精細化權限管控能力。一方面,搭建平臺統一用戶門戶,作為用戶訪問中臺各類功能的入口,實現操作入口的集中化。另一方面,支持兩種用戶管理模式,即可在平臺內直接創建和管理用戶,也能集成外部用戶管理系統,避免用戶信息重復維護。同時,基于業務需求與組織架構,對用戶進行詳細權限劃分,并支持分級委派管理,最終實現平臺內所有用戶的統一身份認證、統一權限分配與統一生命周期管理,保障運維操作的安全性與權限管控的靈活性。
(五)容器管理平臺
容器管理平臺是一個用于支撐業務容器化及微服務化的核心工具,也是一種DevOps的實踐落地的關鍵載體。圍繞“持續交付+全生命周期管理”構建核心能力,提供持續集成、持續構建、持續部署的端到端支持,實現代碼提交到業務部署的自動化流轉。在此基礎上,構建分布式配置管理、服務發現、兼容JFrog與DockerHub的倉庫管理、安全健康檢查、網絡配置服務等主要功能,覆蓋容器化業務從部署到運行的全場景需求。同時,以SaaS服務形式提供交互,用戶無需重復操作,僅通過頁面點擊即可完成業務鏡像構建、發布等關鍵流程,降低容器化運維門檻,為業務敏捷迭代與微服務架構落地提供高效支撐。
(六)集成平臺
集成平臺是實現“工具快速構建、能力開放集成”的核心支撐平臺,以“開放、高效、低成本”為核心特性,為運維工具與運營系統的全生命周期管理提供一站式解決方案。平臺搭載完善的技術支撐模塊,包括多語言開發框架/樣例、前后端開發框架、企業服務總線(APIGateway)、調度引擎及公共組件,同時提供可拖拽的前端服務(MagicBox),支持用戶簡單、快速地創建、部署和管理運維工具。通過免運維托管服務,結合日志查詢、監控告警等自動化運維能力,覆蓋應用從創建、部署到后續維護的全流程,實現支撐工具與運營系統的低成本、免運維構建,并具備SaaS運營數據可視化功能,助力運維團隊實時掌握工具運營狀態與使用情況,為中臺工具生態的快速擴展與能力復用提供關鍵保障。
三、創新點
(一)開放式架構實現運維工具“場景化集成+敏捷迭代”創新
突破傳統運維工具“孤立部署、重復建設”的痛點,構建開放式一體化平臺。將運維核心功能按業務場景拆解為獨立工具模塊,所有工具統一運行在基礎平臺之上,通過調動底層標準化能力服務實現功能落地,避免工具間能力重復開發;工具模塊間通過APIGateway、服務總線(ESB)實現數據互通與能力復用,功能迭代無需重構整體架構,僅需更新單個工具模塊,實現敏捷迭代;平臺提供工具“創建-部署-運維-下線”全流程支持,通過低代碼開發平臺快速搭建新工具,結合免運維托管服務降低工具維護成本,同時支持第三方工具接入,形成“自研+集成”的工具生態。
(二)微服務架構支撐的“開放可擴展+自主開發”運維中臺創新
以微服務架構為核心,構建開放、靈活、可擴展的運維中臺,滿足個性化開發與業務增長需求。融合SOA分層設計、分布式架構、微服務架構,每個微服務可獨立部署、擴容、迭代;針對不同微服務特點選擇最優開發語言與框架,如數據密集型微服務采用Java+Spark框架保障處理性能,前端交互型微服務采用Vue+ElementUI提升用戶體驗,輕量級接口服務采用Go語言保障高并發響應;中臺底層采用PaaS機構設計,支持私有化部署,提供標準化接口與插件擴展機制,同時支持運維團隊中臺提供的開發框架自主開發個性化應用場景;通過“創建-部署-托管-開發”的全流程支持,運維人員無需關注底層基礎設施,可快速完成應用場景開發與上線。
(三)一體化IT運維流程“可視化編排+靈活控制”創新
突破傳統運維流程“固化、難調整”的局限,實現流程全生命周期可視化與靈活管控。通過拖拽式流程設計器,將運維流程以圖形化方式展示,流程節點、節點依賴關系、執行方式清晰可見,支持流程模板保存與復用;支持自定義控制、人工控制、自動與人工結合,適配不同復雜度運維場景;流程及清單的原子任務支持多類型介入,即可是Shell/Python腳本,也可是應用接口,任務執行過程中支持暫停、跳過失敗院子、失敗重試,精準定位異常節點,減少流程中斷概率;記錄流程執行日志,支持流程執行狀態實時查看與歷史回溯,為流程優化提供數據支撐。
四、項目技術方案
(一)架構設計
此次項目架構參照中國通信標準化協會制定的《云計算運維平臺參考框架及技術要求》,整體設計架構如下:
![]()
以“集中化、可視化、自動化”為核心目標,融合SOA設計理念與金融運維場景需求,構建“IaaS管控層-原子平臺層-PaaS應用層-運維場景層”四層架構體系。各層級自上而下實現“能力封裝-服務集成-場景落地”的遞進支撐,同時配套全鏈路數據流轉與開放集成機制,覆蓋IT資源全生命周期運維管理,為安徽省農信IT體系提供穩定、靈活、智能的運維技術底座。
架構遵循“高內聚、低耦合”原則,每層聚焦核心職責,通過標準化接口實現跨層協同,既保障基礎能力的復用性,又支持上層場景的敏捷擴展,適配金融行業復雜IT環境與運維需求。
1.IaaS管控層:聚焦“基礎資源統一接入與管控”,為上層提供穩定的資源調度與數據傳輸通道。支持Linux、Windows、小型機等操作系統,兼容虛擬機、容器、物理機等計算資源,同時適配私有云、公有云以及混合云架構,實現“一朵云”式統一管控。
2.原子平臺層:基于IaaS層資源管控能力,封裝通用運維基礎能力,形成獨立可復用的功能模塊,包括作業功能模塊、CMDB模塊、運維數據平臺模塊、容器管理模塊、智能運維模塊等功能模塊,為上層提供標準化、原子化的運維服務。
(1)作業功能模塊:運維執行能力核心,支持腳本管理、文件傳輸、任務編排,可落地自動化巡檢、批量部署、災備切換等場景;
(2)CMDB模塊:運維操作對象管理核心,支持硬件設備、服務器、數據庫、中間件全類型對象納管,通過自動發現、Excel導入實現配置采集;同時提供數據質量治理與拓撲可視化,為所有模塊提供精準配置數據支撐;
(3)運維數據平臺模塊:通過Agent采集基礎設施、應用程序、中間件的運行狀態數據,并提供數據清洗、建模、查詢服務,支撐監控告警與智能分析;
(4)容器管理模塊:支持容器鏡像生產、管理、資源調度,提供持續集成、持續構建、持續部署能力,以SaaS服務形式支持頁面點擊完成鏡像構建與發布,適配業務容器化與微服務化轉型需求;
(5)智能運維模塊:基于運維數據平臺模塊的數據支撐,提供異常檢測、關聯分析、預測模型,已實現“業務健康畫像”“智能告警助手”等場景落地,推動運維從“被動響應”轉向“主動預測”。
3.PaaS應用層:基于原子平臺層的基礎能力,構建“應用開發+服務集成”雙核心平臺,通過標準化接口與集成機制,實現原子能力的協同調用,是鏈接“基礎能力”與“場景應用”的橋梁。包含支持應用部署和運行的APaaS(
ApplicationPlatformasaService)以及企業內部SOA集成的IPaaS(IntegrationPlatformasaService),通過企業服務總線和APIGateWay對接原子層各平臺的能力。
4.運維場景層:基于PaaS層集成能力,構建面向具體運維場景的SaaS應用,涵蓋基礎運維、監控告警、ITIL流程、DevOps、任務編排、彈性伸縮、安全審計等各領域,通過“原子能力拼裝”,實現各類運維場景的自動化與智能化,包含基礎運維、CI/CD、監控告警、任務編排、彈性伸縮、安全審計以及移動運維等
(二)應用架構
一套基于SOA微服務架構的,企業級異構化IT資源運維的PaaS平臺型技術解決方案。本期項目實施整體應用架構如下圖所示。
![]()
(三)前端架構
![]()
前端使用內置開發者中心MagicBox提供前端開發框架,框架主要基于Vue、jQuery,通過內置Vue和MagicBox研發的一鍵構建體系前端工程的腳手架,可以基于前后端分離協作研發模式下,更加方便、快捷的構架SaaS,并且基于SaaS前端開發沉淀出的一套研發規范,包含JS、HTML、CSS等,為應用開發的代碼,交互設計體驗,安全和性能等提供規范和建議。開發完成的SAAS系統兼容多種終端顯示設備包含Edge、Chrome、Firefox等。
(四)后端架構
![]()
在開發者中心上開發 SaaS 的后端框架 。該開發框架于 Django 框架,并在此基礎上進行擴展,增加系統的特有功能,例如:身份驗證、ESB 調用及模板渲染等功能,以便開發者可以更專注于運維場景的開發。
(五)數據庫架構
此次系統部署采用達夢數據庫,配置高可用性(HA)架構,通過冗余設計、故障自動檢測和快速切換機制,確保數據庫服務在硬件故障或維護期間持續可用。數據庫內存在運維相關的配置數據、監控數據、告警數據、流程數據。可滿足對外消費以及內部數據持續采集的高并發,高可用場景。
(六)部署架構
![]()
各功能模塊以組件分布式部署為高可用方案,整體資源配置信息如下:
![]()
五、項目過程管理
需求分析階段:2024.04-2024.06
設計階段:2024.06-2024.09
開發階段:2024.09-2024.12
測試階段:2024.12-2025.02
系統上線:2025.02
六、運營情況
本項目上線后,已納管主機95%,覆蓋Linux、Windows、AIX等主流操作系統,同時兼容國產操作系統與小型機,滿足信創改造與傳統剛早于傳統IT環境雙重需求。同時,已成功對接VMware虛擬化平臺、云宏虛擬化平臺等混合云資源管理平臺,通過API接口實現云主機配置數據自動采集。
已納管主機監控覆蓋率達到93%,通過Agent采集主機CPU、內從、磁盤I/O、網絡流量等核心指標,結合自定義監控策略實現異常實時感知,并完成Nginx、Tomcat、TomWeb、達夢數據庫、Redis等組件的監控適配。
應用發布工具已替代傳統人工發布方式,實現全行全應用的發版均在自動化發布工具上實現線上自動發布。自動化發布縮短發版周期,且發布過程無需運維人員全程值守,僅需在關鍵節點介入,單批次發布人力成本降低。
七、項目成效
(一)經濟效益
1.人力成本縮減,運維模式迭代升級:通過自動化運維能力,如自動化巡檢、智能告警、故障自愈等,減少人工干預,傳統需24小時值守的崗位可轉為少人/無人值守模式,且自動化業務部署與批量巡檢能夠替代人工低效勞動,節省大量人力成本。
2.人為誤操作率降低,業務連續性強化:自動化運維減少手工操作導致的人為錯誤,提高業務連續性。故障響應加速:實時監測與預警功能可提前發現潛在故障,減少停機損失。提升系統穩定性。
(二)社會效益
1.故障響應時效質變,安全保障能力提升:通過立體化監控覆蓋與告警治理,應用系統故障感知能力與告警有效性提升近50%,從原先“小時級乃至天級”的故障發現與定位,升級為“分鐘級”。
2.賦能農商銀行,促進數字化轉型:項目能力下沉至安徽省農信社82家轄屬農商行,覆蓋核心應用系統,通過統一運維平臺為基層機構提供標準化運維服務。切實保障農村地區金融服務連續性,助力鄉村振興戰略落地。
八、經驗總結
綜合運維平臺的成功實踐為金融機構數字化、智能化轉型樹立了標桿,系統設計全面貫徹政策導向,融合科技創新,摒棄“煙囪式”工具堆砌,采用PaaS底座實現能力沉淀,如作業引擎、工單流程,形成“管控一體、平臺一體、聯動一體”的工具體系,可通過自主可控的方式持續豐富行業運維場景,為金融機構數字化、智能化轉型提供可復制的實踐標桿。
更多金融科技案例和金融數據智能優秀解決方案,請在數字金融創新知識服務平臺-金科創新社案例庫、選型庫查看。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.