新闻资讯

首页 > 新闻资讯

楼宇自控服务器 盘点:近年来数据中心十大灾难

时间:2023-05-07

对于数据中心而言,保持业务连续性是首要目标。 然而,庞大的数据中心面临诸多潜在风险,小概率事件也可能带来灾难性后果——机房火灾、服务器长期宕机、声誉受损等。 据不完全统计,仅2020年以来,类似的重大故障就发生了十几起。

IDC圈整理列出了近三年数据中心十大灾难。

数据中心火灾前后对比

事件一:韩国SK公司数据中心火灾

2022年10月15日,韩国SK公司C&C板桥数据中心发生火灾,约8小时后火势被扑灭。

火灾发生后,数据中心停电导致包括韩国国民级聊天软件Kakao Talk、主流电商平台NAVER在内的多项网络服务中断。 据《韩国时报》报道,此次火灾导致约3.2万台服务器瘫痪,数千万用户服务受到影响——截至2021年,韩国人口约为5200万。 一天后,Kakao Talk 和其他服务开始恢复。 数据中心客户表示,由于大量服务器丢失,恢复过程花费的时间比预期的要长。

调查发现,安装在地下室三层电器间的5个电池架全部被烧毁,电池和架子附近起火疑似是电气因素引起的。

事件二:湖南电信河源大厦起火

2022年9月16日,位于湖南省长沙市芙蓉区的湖南电信大厦发生火灾。 数十层楼猛烈燃烧。 经初步调查,现场着火的是建筑物的外立面。 为防止发生危险,大楼内部分设备已断电。 据中国电信官方及用户反映,部分用户手机的语音和短信功能受到影响,截至当晚12时仍未恢复。

长沙电信大楼发生火灾-图片来源央视新闻

长沙电信大厦于2000年竣工,地上42层,地下2层。 该大楼包含河源电信机房,是湖南最大的骨干接入点之一。 据此前资料显示,该机房拥有25G光纤直达骨干网,机柜总数约1000个。

事发前的招标信息显示,该楼消防设备超限,火灾报警系统存在重大安全隐患。

事件三:谷歌数据中心电气爆炸

当地时间2022年8月8日,位于美国爱荷华州康瑟尔布拉夫斯的谷歌数据中心发生爆炸,造成三人受伤。

据媒体报道,三名电工在数据中心大楼附近的变电站工作时发生电弧闪光(电气爆炸),被严重烧伤。 事故发生后,多个地区的谷歌地图和谷歌搜索服务中断。 数据显示,该故障影响了全球40多个国家/地区的至少1338台服务器,包括美国、澳大利亚、南非、肯尼亚、以色列、南美部分地区、欧洲和亚洲部分地区。

谷歌确认事故为电气事故,但未透露具体原因。

自吸泵压力灌自控器_楼宇自控服务器_速差自控器 试验周期

事件四:英国高温导致多个数据中心宕机

2022年夏季,欧洲经历了极端高温。 当地时间7月16日,英国气温达到42℃。 伦敦的谷歌云和甲骨文数据中心都因温度过高而出现故障,导致系统停机。

甲骨文报告称,数据中心的两个制冷系统出现故障楼宇自控服务器,导致数据中心内的温度越来越高。 一些系统自动采取保护措施关闭操作,导致一些用户的数据使用延迟。 谷歌还声称,数据中心的冷却系统出现故障,导致该区域部分容量出现故障,导致VM(虚拟机)终止运行,并导致少数客户机器丢失。 与此同时,谷歌关闭了机房的部分机器,以防止进一步的破坏。 损害。

谷歌表示只有“一小部分用户”受到影响。

事件五:网易游戏厅服务器大规模宕机

2021年11月3日,多款网易游戏出现无法登录或掉线的情况。

据《绝对演绎》等游戏官博介绍,原因是机房过热导致服务器宕机。

事发约3小时后,网易游戏服务器已恢复正常登录,网易尚未对故障做出统一回应。

事件六:英国数据中心火灾

2021年8月27日,位于英国首都伦敦的托管数据中心发生火灾,导致停机。 火灾导致大楼一半断电,消防员表示,虽然只有三楼供应室的一小部分被烧毁,但在大火使支撑母线的断路器跳闸后,工程师不得不启动发电机以恢复供电。

据分析,火灾事故很可能是UPS故障引起的。 事故突破了温度保护、灭火、UPS预见性维护、UPS预防性维护等多重保障,最终引发火灾。

事件七:水灾导致河南多处机房停电

2021年7月,河南遭遇特大暴雨,多个数据中心受洪水影响,机房停止服务:

河南移动机房公告

河南移动枢纽机房断电,无法正常处理移动业务; 海腾郑州BGP机房、华中郑州BGP机房等数据中心因该地区市电中断,停电1、2小时以上,机房采用柴油发电机供电。 附近加油站由于路上积水,暂时无法给机房供油。 停电前,考虑到用户数据安全,暂停服务。

西数郑州地区、晋江文学城、河南省产权交易中心用户发布通知,表示服务被机房中断。

IDC圈当时收到的照片显示,河南某数据中心机房进水。

速差自控器 试验周期_楼宇自控服务器_自吸泵压力灌自控器

事件八:OVH数据中心火灾

当地时间2021年3月10日,位于法国莱茵省首府斯特拉斯堡的欧洲云计算巨头OVH数据中心发生严重火灾。 OVH 在该地区拥有的所有 4 个数据中心都已暂停。 四个数据中心中,一个被彻底烧毁,三分之一的服务器被毁。

OVH火灾现场

火灾发生后,法国政府、企业和公共事业单位约有360网站瘫痪,欧洲部分游戏开发商的业务也受到影响,位于数据中心的部分服务器被烧毁。 服务器彻底毁坏,没有备份,数据无法修复。

尽管OVH在短暂调查后解释说火灾可能是由UPS引起的,但一年后法国官方事故调查机构发布的一份报告显示,这场灾难更可能是由配电室的逆变器周围受潮引起的。

事件 9:犹他州 WebNX 数据中心失火

2021 年 4 月,美国托管公司 Web NX 位于犹他州奥格登的数据中心发生火灾,导致超过 360 万个网站出现故障,约 15000 名客户的数据受到影响,部分客户数据完全丢失且无法恢复。

事件十:微软Azure美东数据中心服务中断6小时

2020年3月3日,微软Azure位于美国东部的数据中心发生长达6小时的服务中断,导致客户无法使用Azure云服务。

微软后来透露,冷却系统故障是停电的原因,错误的楼宇自动化控制减少了整个数据中心的气流和随后的温度峰值,阻碍了网络设备的性能,并使计算和存储实例无法访问。

……

当然,2020年以来,数据中心发生的重大故障远不止上述这些。

例如,2020年8月,香港某云机房制冷设备出现异常,导致服务器挂掉3小时; 2022年10月,苏州国科数据中心屋顶因备用冷却塔起火,但影响范围可能比较小。 或苏州国科数据中心等机房、业务不受影响,故不计入。

在此仅盘点发生严重失败、影响重大的事件,供大家了解,以鉴前鉴。

(预测:接下来将发布第二篇数据中心灾难分析文章,深入探讨数据中心故障的高风险,以及近年来出现的新挑战,欢迎继续关注!)

智者多虑,必有失误。 业务连续性是数据中心的第一原则,防灾响应是数据中心分秒必修的“必修课”。 当前数据中心的高可靠性面临诸多新挑战,防灾需要多方共同参与。

将于今年12月举行的第十七届中国IDC行业年度盛典将设立“数据中心防灾与响应”主题论坛,邀请设计院、数据中心企业、基础设备厂商、用户共同探讨如何保证业务连续性。 、防灾和故障应对,分享成功经验和创新技术

让数据中心防“烧”!

咨询热线: 0791-87879191
赣ICP备2020012442号-3 Copyright 2014 江西康沃思物联技术有限公司 版权所有