服務器維護 | 服務器維護計劃有哪些
2020-06-20 21:18 作者:admin
無論購買服務器托管到數據中心,還是租用服務器,您都不必成為服務器專家,但您必須定期維護它。服務器每天24小時運行,每周執行數百萬次交互。所有這些都會造成硬件,軟件,數據庫和服務器的磨損。老舊的服務器設置將不足以處理日益增加的交互數量。服務器軟件將容易受到新的攻擊,SQL表將變得支離破碎,硬盤最終會降級甚至崩潰,最終可能導致服務質量低下,數據丟失或信息被盜。其實所有這些都很容易預防。你所需要的只是一個計劃:
服務器維護計劃。您需要在不同的時間段檢查服務器中的不同內容。
一、服務器維護計劃包括哪些內容?
1.日常維護
軟件更新:防病毒和軟件更新可以在任何一天進行。
安全日志審核:濫用用戶,網站訪問者或僵尸程序可能會從合法用戶那里奪走資源,應該盡快阻止。
漏洞披露:軟件供應商和安全渠道報告未經修補的漏洞或攻擊。緊急修補將保護您的數據。
2.每周:檢查您的備份。如果備份不可用,您將只丟失一周的數據。
3.雙周:審核磁盤使用情況,包括老舊帳戶,未完成的備份,舊的臨時文件等會占用磁盤空間,從而導致磁盤空間問題。
4.每月一次:優化數據庫。繁忙的數據庫在一個月內可能產生3%-5%的碎片。
5.雙月:調整應用程序。由于流量模式可能會在兩個月內發生變化,因此未經優化的設置會影響速度。
6.一天24小時:監控服務器運行狀況。可以通過負載高峰等早期跡象發現服務器故障。早期檢測可以防止完全停機。您需要檢測的內容包括RAID健康、服務器溫度、負載平均值、網絡連接等。
二、如何構建適合您的服務器維護計劃
您可以根據
服務器維護活動的目標,來細分
服務器維護活動,然后找出實現該目標需要完成的工作。例如:緊急響應,您需要知道您的服務器是否發生了不好的事情,您需要在出現問題時快速恢復服務。預防措施包括:主動審核和檢查系統,以防止可能的服務降級或誤用。它可能包括:安全檢查,績效審計,資源使用審核等。保險措施包括:備份審核,鏡像故障轉移測試,高可用性測試。
三、制定服務器維護應急響應計劃
可能出現故障的軟件和硬件組件類型在數據庫服務器,郵件服務器和Web或應用程序服務器中會有所不同。因此沒有一個適合所有人的列表,來列出服務器中需要監控的所有故障。您需要考慮一下服務器可能出現故障的常見方式,以及如何及早發現它們。例如:Web服務器可能存在以下問題:容量錯誤(流量的突然增加可能耗盡內存,并使磁盤過載,導致響應遲緩);用戶濫用(在共享環境中,某些用戶可能會運行資源繁重的腳本,從而導致服務器負載);
網絡攻擊(僵尸網絡通過在網站上執行數千個同步查詢來完成大規模攻擊);Bug腳本(編碼不良的腳本可能導致內存泄漏或其他資源過度使用);網絡故障(Web服務器可能會丟失與后端數據庫服務器或其他應用服務器的連接);硬件錯誤(從RAID降級到溫度問題,各種各樣的問題都可能導致服務器運行不良或凍結);惡意軟件注入(黑客可能會使用未公開的漏洞將惡意軟件注入服務器);IP/網站聲譽問題(搜索引擎可以檢測到惡意軟件注入的網站從而降低網站權重)等等。為預防這些故障,您需要每周7天,每天24小時監控與這些問題相關的服務器參數。它可能包括負載均衡,內存使用,I/O使用等。在列出適合您的服務器類型的所有這些方案和服務器參數后,列出您需要采取的操作以使服務重新聯機。緊急行動需要提前考慮,因為您沒有時間停下來思考服務何時失敗。
四、制定預防性服務器維護計劃
預防性維護的目標是審核和調整服務器和服務的每個部分,以便它不會失敗。同樣,您需要檢查的內容將根據您運行的服務器類型而有所不同。我們來看一個數據庫SQL服務器的例子。MySQL服務器維護計劃將包括:
碎片整理(又名表優化):數據庫中頻繁的“刪除”會使表格碎片化。每月優化一次表,以防止性能問題和可用空間的損失。
分析(優化索引):MySQL使用索引快速查找所需的數據。大約每月運行一次“分析”以簡化索引,并使查詢執行更快。
完整性檢查:有時,由于數據庫崩潰或應用程序錯誤,MySQL索引會丟失對數據集的跟蹤。每周檢查數據庫完整性以防止查詢錯誤。
磁盤運行狀況檢查:服務器日志中記錄了HDD或RAID錯誤。此類錯誤是即將發生故障的早期指示,您可以采取措施更換磁盤。
空間使用檢查:您的數據庫需要增長空間,進行備份和進行大型事務。每月檢查一次陳舊文件,臨時文件或舊備份。
群集效率分析:數據庫群集應有效地同步數據,以防止查詢延遲和數據錯誤。早期檢測同步滯后可以防止代價高昂的數據庫崩潰。
錯誤日志審核:如果MySQL服務器檢測到索引或表損壞,則會記錄錯誤。定期錯誤日志審核將防止意外停機。
慢查詢分析:MySQL會將執行效果不佳的查詢記錄到文件中。對這些查詢和服務器調整的每周分析可能會阻止性能日志。
服務器速度審計:每月速度測試可以顯示MySQL服務器執行查詢的效率。通過及早發現和修復瓶頸,您可以避免性能問題。
五、規劃災難恢復
您的服務器硬盤都有一定的壽命。有些數據可能會丟失。那時的重要問題是,“你多久能恢復?”如果您已準備好應對這種可能性,那么它可能只需1分鐘。在機房,我們維護著Web主機,數據中心和其他在線服務器。我們的每個業務都有不同級別的可用性要求。有些人可以忍受數小時的停機時間。有些人甚至不能容忍一分鐘的停機時間。因此,我們部署了廣泛的解決方案,以確保業務連續性,從高可用性集群和容錯硬件到故障轉移鏡像和增量備份。至少,您的災難恢復計劃應包括備份審核。一些檢查是:
狀態檢查:備份是否每天都成功完成?它顯示錯誤了嗎?
數據完整性檢查:備份存檔是否已損壞?是否可以從中檢索數據
磁盤空間檢查:磁盤空間不足?是否有空間接收下周的檔案?
恢復過程檢查:當前恢復方法是否有效?是否存在連接錯誤或其他阻止快速恢復的問題?
構建災難恢復計劃的出發點是問自己,您希望能夠以多快的速度恢復服務。然后向后工作所需的系統,涉及的成本,以及您愿意接受的權衡。
以上內容由北京艾銻無限科技發展有限公司整理