数据中心(Data Center)是大范围协作的特定设备网络,用来在Internet网络基础设施上加速信息的传递。又可以细分为企业级数据中心、其他数据中心等。下面我们就分享下数据中心设计建造中的八个事实。
1.只要有功率输入,即有热量输出
在数据中心的供电系统中,绝大部分电能是要转化成热量的,只有少数电能是真正得到利用的。这是由于数据中心的供电线路存在电阻所致,除非你的数据中心采用超导体供电,否则你将永远为这些散失到空间里的热量付费。
2.最终还是会发生故障
系统故障的发生概率分布符合随机模式,这意味着你永远也无法将事故发生概率降低至零。需要注意UPS到负载之间的路径以及制冷系统的冗余容错功能。
3.电负载的密度会继续增加
若干年前,一个服务器机架只装不到十台服务器,而现在可容纳几十台刀片服务器;若干年前,每个机架的平均功率是1~2kW左右,现在是3kW甚至更高,高密度机架甚至从3~5kW增长至20~25kW。因此,电费将是影响数据中心发展的重要因素之一。
4.对可用性的要求将提高
宕机的损失变得越来越大。若一个网站宕机,一个潜在的客户就会在8秒钟之内离开,去访问另一个网站;若一个路由器宕机:局域网上就可能有几百个用户无法工作;若一个光纤室宕机:就可能有几千个用户断开网络连接,损失不可估量。
5.操作人员若并非训练有素,会增加数据中心故障的可能性
由于人才紧缺、人力成本高昂以及培训机构缺位等诸多原因,如今的数据中心操作人员,大部分都很少甚至没有培训。这样一来,数据中心操作人员不得不通过手动操作和不正规的培训获得知识,通过犯错误、甚至造成代价高昂的宕机获得知识,这是极为得不偿失的。
6.系统可能在状态变化过程中(例如维护)发生故障
发生故障的时间和导致发生故障的时间是物理学定律和人类行为规律两者的结合。以灯泡为例:打开灯泡,灯丝温度迅速变化,灯丝材料热扩张,导致灯丝断裂;而UPS中的IGBT器件,也会在开机时因热冲击显示类似的故障模式。同样道理,冗余和备份系统可能会在切换时出现故障。由于人为因素,系统在状态变更之后更容易出现故障,可能是因为系统没有正确地返回运行状态所导致。
7.任何设备都需要维护
主动检查所有设备有助于延长设备的使用寿命,预测和预先发现潜在的问题,永远走在故障前面。
8.数据中心需要经历四至五代的IT设备更迭
如果数据中心生命周期大于15年,IT设备经常3~4年就要更换,每年都可能有很大的变化。 |