服務(wù)器運維 | 游戲公司的自動化運維體系建設(shè)
2020-05-29 17:01 作者:艾銻無限 瀏覽量:
艾銻無限是一家專門做企業(yè)
網(wǎng)管外包服務(wù)的機構(gòu),通過線上+線下結(jié)合的服務(wù)方式,為企業(yè)提供
電腦維修、辦公設(shè)備維護、系統(tǒng)維護、網(wǎng)絡(luò)與數(shù)據(jù)安全、服務(wù)器運維等專業(yè)的網(wǎng)管服務(wù)外包公司
在很多初創(chuàng)公司和中小型企業(yè)里,
服務(wù)器運維還停留在“刀耕火種”的原始狀態(tài),這里所說的“刀”和“火”就是
服務(wù)器運維人員的遠(yuǎn)程客戶端,例如SecureCRT和Windows遠(yuǎn)程桌面。在這種工作方式下,服務(wù)器的安裝、初始化,軟件部署、服務(wù)發(fā)布和監(jiān)控都是通過手動方式來完成的,需要
服務(wù)器運維人員登錄到服務(wù)器上,一臺一臺去管理和維護。這種非并發(fā)的線性工作方式是制約效率的最大障礙。同時,因為手動的操作方式過于依賴
服務(wù)器運維人員的執(zhí)行順序和操作步驟,稍有不慎即可能導(dǎo)致服務(wù)器配置不一致,也就是同一組服務(wù)器的配置上出現(xiàn)差異。有時候,這種差異是很難直接檢查出來的,例如在一個負(fù)載均衡組里面?zhèn)€別服務(wù)器的異常就很難發(fā)現(xiàn)。隨著業(yè)務(wù)的發(fā)展,服務(wù)器數(shù)量越來越多,
服務(wù)器運維人員開始轉(zhuǎn)向使用腳本和批量管理工具。腳本和批量管理工具與“刀耕火種”的工作方式相比,確實提升了效率和工程質(zhì)量。但這個方式仍然有很多問題。第一是腳本的非標(biāo)準(zhǔn)化的問題。不同的
服務(wù)器運維人員寫的腳本在所用的編程語言、編碼風(fēng)格和健壯性方面存在巨大差異,同時這些腳本的版本管理也是一個挑戰(zhàn)。第二是腳本的傳承問題,人員的離職和工作交接,都會導(dǎo)致腳本無法很好地在
服務(wù)器運維人員之間傳承和再利用,因為下一個
服務(wù)器運維人員可能無法理解和修改前一個
服務(wù)器運維人員編寫的腳本功能。第三是批量管理工具的選擇。不同的管理人員選擇不同的批量管理工具必然會帶來管理混亂的問題,也無法很好地實現(xiàn)在
服務(wù)器運維人員之間互相備份工作的需求。因此,對構(gòu)建自動化運維體系的要求變得越來越迫切。
通過自動化運維體系來實現(xiàn)標(biāo)準(zhǔn)化和提高工程效率,是唯一正確的選擇。那么如何建設(shè)自動化運維體系呢?分為三個大的方面:
第一個是為什么要建設(shè)自動化運維體系,就是解決“3W”中的Why和What的問題,即為什么和是什么。
第二個是介紹我司各個運維子系統(tǒng)是怎樣設(shè)計、運行和處理問題的,解決“3W”中的How的問題,也就是怎樣去做的。
第三個是對我司在自動化運維過程中遇到的一些問題的思考,做一個總結(jié)。
一、建設(shè)自動化運維體系的原因先來看一下我們?yōu)槭裁匆ㄔO(shè)一個自動化運維體系。首先來看運維遇到的一些挑戰(zhàn),如下圖所示。
運維面對的挑戰(zhàn)第一個是游戲的需求。它表現(xiàn)為三個方面:一是游戲數(shù)量多,我司現(xiàn)在運營的游戲多達(dá)近百款。二是游戲架構(gòu)復(fù)雜。游戲公司和一般的互聯(lián)網(wǎng)公司有一個很大的區(qū)別,就是游戲的來源可能有很多,比如有國外的、國內(nèi)的,有大廠商的、小廠商的;每個游戲的架構(gòu)可能不一樣,有的是分區(qū)制的,有的是集中制的,各種各樣的需求。三是操作系統(tǒng)種類多,這與剛才的情況類似,游戲開發(fā)者的背景與編程喜好不一樣,會有Windows、Linux等。第二個是在硬件環(huán)境方面,主要表現(xiàn)為服務(wù)器數(shù)量多、服務(wù)器型號多。因為公司從建立到現(xiàn)在有十幾年的時間了,在這個過程中分批、分期采購的服務(wù)器幾乎橫跨各大OEM廠商的各大產(chǎn)品線,型號多而雜。最后是人的因素。我們在建設(shè)自動化運維體系過程中,有一個比較重要的考慮點是人的因素。如果大家的技術(shù)能力都很強,很多時候一個人可以完成所有工作,可能也就不需要自動化運維體系了。正是因為每個
服務(wù)器運維人員的能力不一樣,技術(shù)水平參差不齊,甚至是運維習(xí)慣和工具也不一樣,導(dǎo)致我們必須要創(chuàng)建一套規(guī)范的自動化運維體系,來提升工作效率。
二、建設(shè)自動化運維體系的目標(biāo)再看一下建設(shè)這套自動化運維體系的目標(biāo),也就是說我們的原則是什么?自動化運維體系的建設(shè)目標(biāo)總結(jié)為四個詞。
第一個是“完備”,這個系統(tǒng)要能涵蓋所有的運維需求。
第二個是“簡潔”,簡單好用。如果系統(tǒng)的操作流程、操作界面、設(shè)計思想都比較復(fù)雜,運維人員的學(xué)習(xí)成本就會很高,使用的效果是會打折扣的,系統(tǒng)的能力、發(fā)揮的效率也會因此打折扣。
第三個是“高效”,特別是在批量處理或者執(zhí)行特定任務(wù)時,我們希望系統(tǒng)能夠及時給用戶反饋。
第四個是“安全”,如果一個系統(tǒng)不安全,可能導(dǎo)致很快就被黑客接管了。所以安全也是重要的因素。
三、自動化運維體系的結(jié)構(gòu)和運作方式下圖所示是我們當(dāng)前自動化運維體系的幾個子系統(tǒng),我們來看一看它們是怎樣聯(lián)合起來工作的。首先服務(wù)器會經(jīng)由自動化安裝系統(tǒng)完成安裝,然后會被自動化運維平臺接管。自動化運維平臺會對自動化安檢系統(tǒng)、自動化客戶端更新系統(tǒng)和服務(wù)器端更新系統(tǒng)提供底層支撐。自動化數(shù)據(jù)分析系統(tǒng)和自動化客戶端更新系統(tǒng)會有關(guān)聯(lián)關(guān)系。自動化數(shù)據(jù)分析系統(tǒng)會對自動化客戶端更新系統(tǒng)的結(jié)果給予反饋。
以上內(nèi)容由北京艾銻無限科技發(fā)展有限公司整理