當前位置:萬佳範文網 >

工作方案 >應急預案 >

通信機房停電應急預案

通信機房停電應急預案

核心機房電力的保障一直是維護體系的頭等重要事項,通過實施應急發電演練,建立了可靠的應急預案機制,最大限度的降低電源中斷對網絡傳輸質量的影響。現分享核心機房電源中斷應急預案,希望分公司儘快建立一套統一指揮、職責明確、反應迅速、處置有力的機房安全保障機制。

通信機房停電應急預案

組織架構:

責任領導、工程維護、網絡監控、網絡運維、質量管理等相關人員。

機房電源系統説明:

1、機房電力是兩路三相四線制供電,進線線纜規格為:RVV50*4+16*1銅芯護套線。

2、機房電源系統採用三級防雷系統,三級防雷分別位於電源進線端、UPS輸入前端。

3、機房現有兩台60KVA-UPS電源,均處於正常運行狀態。

4、機房現有設備機櫃已編號,均通過UPS電源和市電供電,每個機櫃有獨立的20A空氣開關。空調、牆壁插座開關、應急燈、照明等都是單獨空開接市電。

5、運行中的UPS電源所帶負荷,在逆變運行狀態下能正常工作約4小時(已經過UPS放電測試)。

一、核心機房電源中斷預案

1、在接到停電通知的情況下:

1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯繫人備案在物業處),機房管理員接到計劃停電通知後,升級到調度中心進行信息發送,同步進行郵件通知相應應急小組成員。並與負責組長及責任領導電話告知,確保已經接收到本次停電的時間及可能發生的情況。

2)維部進行發電應急預案小組成員通知,提前做好機房發電預案要求的準備工作,將相應的發電機、連接線、人員安排到位,各司其職,隨時待命現場,做發電準備工作。確保停電時刻的電力安全及機房用電的保障措施,提前調度安排好相應人員做好保障用電的措施。

3)計劃停電時間開始後,馬上啟動應急發電操作,按照機房發電操作步驟實施階梯供電的步驟,恢復市電保障。並進行現場值守及設備工作確認,確保全部正常後電話告知調度中心及維護體系領導。

2、在沒有接到任何通知,突然發生停電的情況下:

確認停電線路,停電時刻,停電時間等要素,啟動核心機房發電應急預案。

1)值班網管工作流程:

⑴值班網管監控到核心機房停電,第一時間告知工維部、網絡部、運維部應急小組組長。信息傳達到工維部機房管理員(一主一備),告知停電開始時間。

要求在停電5分鐘內將消息傳達到調度中心,各應急小組組長。如無法聯繫上,進行升級到責任領導-工維部經理經理處。

⑵網管將停電信息電話傳達後,進行調度派單,確保全部的應急小組成員都收到本次故障停電的信息。然後進行機房中設備的檢查,包括:UPS設備主機、各核心設備、匯聚設備、服務器、語音系統等。檢查是否受影響。同時啟動機房降温措施(降温方案:初步為加裝抽排風設備、增加大風扇排風形成熱量流動降温)

⑶實時監控設備及UPS工作情況,包括:電量下降情況,設備工作正常情況,每15分鐘通報一次電量情況。

2)運維部應急工作流程:

⑴運維應急同事接到故障通告後,第一時間往停電現場趕,到現場配合網管/工維部門進行設備儀器的檢查、客服語音系統的保障,應急發電的協助。

⑵現場配合進行機房降温散熱措施實施,實時檢查網絡設備的工作情況。

3)運營質量管理應急工作流程:

⑴調度中心值班人員接到網管監控調度信息後,第一時間將故障信息記錄併發故障通告到相關應急成員,並電話通知各應急小組組長是否知悉。

⑵進行客服調度系統的設備工作運行系統檢查,特別語音系統級坐席電腦,是否有問題,如發現工作系統有異常,及時與運維應急小組成員溝通,進行檢查處理。

⑶實時關注故障工單流程進度登記,配合應急小組進行人員調度通告。

4)工維部應急工作流程:

⑴機房管理員第一時間往停電現場趕,同時進行電話溝通供電公司、物業方等,諮詢停電原因,是屬於計劃性還是突發性停電,預計停電時長,將諮詢清楚的結果反饋到應急小組成員中,電話聯繫物業溝通好需要發電需求申請。

⑵工維應急小組組長接到時間後第一時間往停電現場趕,同時進行發電應急小組成員調度,安排第一時間到場工作開展,並升級通報告知主管領導,對口集團維護中心上報信息。

⑶工維應急小組成員接到停電時間後第一時間往停電現場趕,要求30分鐘內必須到場(住機房附近的人員往現場去,較遠同事可以進行打車往現場去),先行到處同事配合網管、運維同事啟動做好應急發電前的準備:連接線布放、接續、發電機發電前檢測油/電/水路檢查,確保正常。確保一切就緒後,確認可以進行發電操作後,按照發電操作流程進行發電恢復市電。

⑷網管將監控到停電的相應信息及級別同步發送到運營質量管理部調度崗,由調度崗將相應信息進行工維、運維、網絡關聯同事進行信息告知,同時報工維主管領導知悉。

5)應急機房發電操作流程:

⑴機房用電系統包括四方面:空調製冷、主/備UPS主機、照明系統、客服調度系統。

⑵發電前考慮4方面系統設備用電功率情況,為保障發電機帶動的正常,不能進行同步供電,要區分優先恢復的步驟實施,確認發電機的工作正常。在發電前將需要供電的“空調製冷、主/備UPS主機、照明系統、客服調度系統”的市電輸入主開關關閉。防止同步啟動時發電機的無法供電保證。

⑶啟動發電機,檢測發電輸出電流通斷,待發電機運行穩定後。

第一步啟動空調製冷系統的市電輸入開關,運維應急小組成員重新啟動空調主機(空調因為市電恢復後需要重新啟動)觀察空調製冷工作是否正常。

第二步啟動主UPS設備的市電輸入開關,觀察發電機運行穩定情況,主UPS主機工作穩定情況,網絡設備的工作正常與否。

第三步啟動客服系統的市電輸入開關,包括(客服坐席電腦、UPS設備、空調製冷等),觀察發電機運行穩定情況,設備恢復工作情況。

第四步啟動備UPS設備、市電照明的市電輸入開關,觀察發電機運行穩定情況,備UPS主機工作穩定情況,網絡設備的工作正常與否。

⑷發電機啟動,市電輸入正常後,網管將降温系統的抽排風設備關閉,與運維同事進行所有設備的運行進行全面的檢查,確保設備已經是運行正常。

⑸發電機發起市電正常後,工維應急小組安排專人現場值守,及時關注發電機油量情況,同時與油品供應商確認油品配送要求及時間要求,並實時與供電部門確認市電恢復時間。

6)停電過程中突發事項預防:

⑴網管在停電時進行機房確認運行中的UPS工作組、設備組工作狀態。主/備UPS工作切換是否正常,在市電中斷時UPS是否已經開始進行供電保護。

⑵值班網管對機房中的所有設備進行全面檢查,確保所有的設備已經是有主備供電,市電中斷後UPS已經正常保障設備工作。同時對機房的温度進行觀察,温度是否突然升高。

⑶停電後,UPS處於逆變工作狀態,當班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負荷情況、機房環境温度,儘量使蓄電池容量大於60%,帶負荷小於85%(因為已經有自購發電機應急,儘快要求短時間發起電,減少UPS的放電過度)。

⑷發現機房環境温度大於26℃。當以上指標不能保證時,要及時向機房管理員彙報,同時上報責任領導知悉,網管預案小組成員經過慎重討論,適時採取關閉不必要網絡的網絡設備、加強通風降温等措施儘量延長關鍵設備運行時間。

  • 文章版權屬於文章作者所有,轉載請註明 https://wjfww.com/fangan/yingji/x76qo3.html
專題