
隨著企業服務器數量越來越多,當到達幾百臺,上千臺服務器之后,服務器日常管理也逐漸繁雜,每天如果通過人工去頻繁的更新或者部署及管理這些服務器,勢必會浪費大量的時間,而且有可能人為的操作也會造成某些疏忽和遺漏。那我們來看一下傳統的運維以及今后運維的發展方向。

A、傳統運維:
傳統的IT運維是等到IT故障出現后再由運維人員采取相應的補救措施。這種被動、孤立的IT運維管理模式經常讓IT部門疲憊不堪,主要表現在以下三個方面:
1、運維人員被動、效率低
在IT運維過程中,只有當事件已經發生并已造成業務影響時才能發現和著手處理,這種被動“救火”不但使IT運維人員終日忙碌,也使IT運維本身質量很難提高,導致IT部門和業務部門對IT運維的服務滿意度都不高。
2、缺乏一套高效的IT運維機制
目前許多企業在IT運維管理過程中缺少自動化的運維管理模式,也沒有明確的角色定義和責任劃分,致使問題出現后很難快速、準確地找到根本原因,無法及時地找到相應的人員進行修復和處理。或者是在問題找到后缺乏流程化的故障處理機制,而在處理問題時不但欠缺規范化的解決方案,也缺乏全面的跟蹤記錄。
3、缺乏高效的IT運維技術工具
隨著信息化建設的深入,企業IT系統日趨復雜,林林總總的網絡設備、服務器、中間件、業務系統等讓IT運維人員難以從容應對,即使加班加點地維護、部署、管理也經常會因設備出現故障而導致業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分原因是企業缺乏事件監控和診斷工具等IT運維技術工具,在沒有高效的技術工具支持下故障事件很難得到主動、快速的處理。

B、自動化運維
IT運維已經在風風雨雨中走過了十幾個春秋,如今它正以一種全新的姿態擺在我們面前–自動化,這是IT技術發展的必然結果。現在IT系統的復雜性已經客觀上要求IT運維必須能夠實現數字化、自動化維護。
運維自動化是指將IT運維中日常的、大量的重復性工作自動化,把過去的手工執行轉為自動化操作。自動化是IT運維工作的升華,IT運維自動化不單純是一個維護過程,更是一個管理的提升過程,是IT運維的最高層次,也是未來的發展趨勢。
1、運維自動化的具體內容
日常IT運維中大量的重復性工作(小到簡單的日常檢查、配置變更和軟件安裝,大到整個變更流程的組織調度)由過去的手工執行轉為自動化操作,從而減少乃至消除運維中的延遲,實現“零延時”的IT運維。
簡單的說,IT運維自動化是指基于流程化的框架,將事件與IT流程相關聯,一旦被監控系統發生性能超標或宕機,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。
2、建立高效的IT自動化運維管理
建立高效的IT自動化運維管理步驟主要包括以下幾點:
1)建立自動化運維管理平臺
IT運維自動化管理建設的第一步是要先建立IT運維的自動化監控和管理平臺。通過監控工具實現對用戶操作規范的約束和對IT資源進行實時監控,包括服務器、數據庫、中間件、存儲備份、網絡、安全、機房、業務應用和客戶端等內容,通過自動監控管理平臺實現故障或問題綜合處理和集中管理。
2)建立故障事件自動觸發流程,提高故障處理效率
所有IT設備在遇到問題時要會自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維屏幕上。然后IT運維人員只需要按照相關知識庫的數據,一步一步操作就可以。
3)建立規范的事件跟蹤流程,強化運維執行力度
需要建立故障和事件處理跟蹤流程,利用表格工具等記錄故障及其處理情況,以建立運維日志,并定期回顧從中辨識和發現問題的線索和根源。
4)設立IT運維關鍵流程,引入優先處理原則
設置自動化流程時還需要引入優先處理原則,例行的事按常規處理,特別事件要按優先級次序處理,也就是把事件細分為例行事件和例外關鍵事件。
5)IT自動化運維工具簡化運維管理
根據IT環境選擇合適的自動化運維工具,不失為有效的運維手段。自動化運維工具能實現對IT資產的實時監控,運維人員通過系統的統一界面即可了解所有軟硬件設備的狀態。自動化運維工具還可以實現故障定位,一旦出現問題,系統會及時通知負責人,并定位故障點,大大縮短排查時間。