河北慧日信息技术有限公司

消防系统故障导致微软 Azure在北欧地区服务中断

更新时间:2017年10月10日  11320浏览


      日前据悉,微软公司在欧洲的一个数据中心消防系统在日常维护期间意外释放了灭火气体,引发了一系列不幸事件,导致7小时的中断。

      在微软Azure网站的事件报告中,微软公司解释说,在灭火气体释放后,导致空调自动停止运行,导致环境温度升高,从而导致一些系统自动停机。

      此次停电意味着微软Azure的一些北欧客户在9月29日13时27分至20时15分期间在连接或管理其云资源时出现问题。

      微软公司解释说,"在常规的定期灭火系统维护中发生了意外,释放出了灭火剂。而当抑制被触发时,导致了专门用于遏制和安全的空气处理单元(AHU)自动关闭。尽管数据中心的状况得到重新确认,AHU正在重启,其受影响的隔离区的环境温度仍高于正常的运行参数。

      而受到影响区域的某些系统会进行内部热健康监测触发的自动停机或重新启动,以防止这些系统过热。并立即触发灭火,在随后的35分钟内,所有空气处理单元(AHU)都被重新恢复,环境温度恢复到正常的运行水平。"

      微软公司还表示,"由于上述事件的性质以及受影响的抑制隔离区的热状况的差异,一些服务器和存储资源没有以受控的方式关闭。因此,需要额外的时间才能对受影响的资源进行故障排除和恢复。"

      微软公司对受影响的用户表示歉意,并表示正在采取措施以确保类似事件不再发生,其中包括进行抑制系统维护分析,以查明为什么会释放灭火气体。

      这并不是第一次在数据中心发生灭火系统的问题:去年在ING公司数据中心中,灭火系统释放时的气体噪音和振动损坏了机房的一些硬盘驱动器,使其数据中心中断10小时。

      英国格拉斯哥一个数据中心也发生了类似的中断事故,气体灭火器烈爆炸破坏了IT系统。



微信扫码关注

Tel  :400-0311-765

Add:石家庄市高新区物联网大厦一层