智能微模块 构建智慧数据中心的基石
转文
摘要:当前,数据中心已经成为企业生产系统重要的组成部分,是企业提升竞争力与运营效率的重要工具。随着个人信息消费需求、企业信息化程度的爆炸性提高及大数据、云计算、物联网的兴起,近年来数据中心的投资增速飞速增长,规模日益增大、密度不断提升,数据中心的复杂程度越来越高,据工信部统计,我国仅在建的1万机架以上的超大型数据中心即有23个。
数据中心的大型化增加了数据中心的建设运营的复杂度与约束,传统建设模式面临着前所未有的挑战。
当前数据中心面临的挑战
数据中心基础设施生命周期远超出IT设备。UPS的寿命大约为10年,空调的寿命约为10-15年,而配电设施更可以达到20年以上,企业很难预测在此时间内IT系统的业务需求与发展。当业务增长时,基础设施扩容困难,因此传统数据中心基础设施通常采用在规划阶段采用一次性部署完成的策略,致使初期投资大、负载率低、能耗高、投资回报周期过长。而且传统数据中心工程化的建设方式过程复杂,多个子系统相互耦合,涉及多个施工单位,建设周期长,无法满足业务快速上线的需求。当前虚拟化、云计算、物联网、大数据等技术的发展正带给IT系统革命性的变化,进一步增加了业务上线的速度要求及预测未来业务发展的难度,传统数据中心更加无法适配业务发展变化对基础设施弹性的需求。
电费开支是数据中心的长期运营成本,其投入常超出基础设施的投资。以部署1MW IT设备、PUE为2的数据中心为例,其年耗电可达到1752万kWh,十年的生命周期内耗电就达到1.75亿kWh。在全球范围内,数据中心的年耗电量已达3000亿度,约占全球总发电量的1%-2%,相当于1亿吨标准煤,对环境有不可忽视的影响。当前国外数据中心的PUE约为1.8,国内大部分数据中心PUE在2.2-3.0之间,非IT设备能源消耗过高,巨大的电费支出侵蚀了企业的利润,增加了企业的经济负担。
传统数据中心更多关心的是供电和空调制冷可靠,只需满足基本的日常运行需求即可。对于精细化的运营管理不关注,而以粗放、低效的运营方式为主,产生了大量浪费,数据中心ROI处于低水平。具体表现在:①缺乏完善的状态数据,关键数据依赖人工巡检采集,更不用谈自动报表与智能分析;②系统缺乏前瞻性的预防措施,必须在故障之后才发现问题,故障之后处理速度慢,无法快速定位消除故障;③运营效率低下,需要大量的人力、电力、空间等资源投入满足管理与运行需求;④资产与资源利用率低,依靠人工优化,缺乏识别低效环境、提升效益的工具与方法。随着数据中心规模与复杂度的增大、能源和人力成本的上升,传统上依靠大量资源消耗、人力投入的运营维护方式难以为继,亟需改变。
传统数据中心的设计为确保物理安全和运行可靠性,仅将基础设施进行多重冗余设计,缺乏从运营角度保障系统的可靠性。比如,缺乏环境、设备状态与健康程度的实时监测,当IT配置发生变化时,不能及时确认供电与制冷的冗余情况,系统的健康程度无法及时获得。而依赖冗余保障可靠性的方式也导致实际负载量远远低于设计容量,基础设施低效运行,后端能耗等成本大大增加。
传统数据中心僵化的建设模式、高能耗、高投入的运营模式已经无法适应数据中心大型化、精益化的趋势,更难以匹配现代数据中心贯穿于整个规划建造过程中多层次、相互依存、分布式、网络化的特征。数据中心的建设运营必须完成从僵化到柔性、从粗放到精细、从依赖人力到依赖流程与工具的转变,实现以高弹性、高效、高可靠及高度智能化自动化为特征的智慧数据中心。智慧数据中心具备以下特征:
1) 上线速度快,易于叠加,按需在线扩展,以保护投资,确保每一分投资的效益最大化。
2) 通过使用高效的供电、制冷方式实现非IT设施的节能,降低PUE,结合绿色IT系统,确保满足业务需求的前提下整体能耗最小;并通过自学习、自优化能够协同数据中心内各个系统与部件实现最优化状态运行,进一步降低能耗与PUE,降低企业成本。
3) 数字化、使系统可视可管。数字化实现器件级、部件级、系统级的可量化可感知,让数据中心简单易管,所有设备信息尽在掌控。
4) 智能化实现系统自动管理和维护。传统数据中心网点众多,实行单点监控,分散管理,导致经验无法共享,团队无法复用,使得运维成本成倍上升。这就要求智慧数据中心能够实现统一、智能管理,能够提供大平台满足大容量监测的需求,并提供大数据分析能力,实现自动管理和维护。
5) 网络化实现高效运营。智慧数据中心趋向于网络化统一管理,实现分层管理集中监控。高效运营主要体现在三方面,节能降耗,实现全网数据中心多层级、精细化能耗管理,构建绿色数据中心;最佳资产管理,全网资产的全生命周期管理;容量最优,全网数据中心配电、制冷、空间的精准监控,系统容量的三相平衡。
智慧数据中心提倡数字化、智能化、网络化的方式使数据中心实现高弹性、高效、高可靠的目标。这个趋势和方向已经得到了业界的广泛认可,围绕“智慧”两个字,国内外众多涉及数据中心基础设施领域的知名厂商都在悄然进行技术布局。如何结合物联网技术,以新型的气流组织管理理念,使复杂的大型数据中心变成如家用电器一样易管理易维护的产品化设备,一时间成了热门的话题,甚嚣尘上。
与此同时,模块化的发展这几年下来也愈演愈烈。早期模块化以Google、Facebook近年来建设的众多大型数据中心为例,采用集装箱框架的模块化单元,应用标准化的冷、热通道隔离技术,来快速建设高效、低PUE的模块化数据中心。在土地资源紧缺的国内,尤其是东部,直接照搬他们的经验显然未必合适。室内模块化因更适合多层建筑而逐渐成为国内数据中心发展的主要方向,微模块类产品在移动、电信、腾讯、世纪互联等电信互联网巨头已经广泛应用,因其灵活性和可预测性也深得大中型企业青睐。
而一些走在行业前列的厂商,已经开始更进一步,在智慧数据中心的大构想下,结合模块化理念,推出智能微模块产品。据知情人士透露,住建部和工信部将会针对数据中心行业起草数据中心节能、检测、运维等标准草案,同时也在考虑把微模块,尤其是智能微模块相关标准纳入其中,以提升我国的数据中心能源利用和管理效率。
那么智能微模块,究竟有什么优势,笔者认为,主要还在于以下几点:
智能微模块沿袭和继承了模块化数据中心的优势,将复杂的数据中心系统分解为多个可独立支撑业务的标准功能单元,并根据业务需要配置不同数量的模块,实现按需投资。不过难能可贵的是,智能微模块在传统模块化数据中心的基础上,进一步将传感器及通讯无线化,可缩短安装交付周期至3周,支持业务快速上线,相比之下,建造传统的数据中心通常需要数月,甚至数年。在时间维度上,智能微模块可作为最小复制单元。当业务增长时,无需过多规划、设计即可直接复制,实现按成长付费模式投资,避免一次性投资过多。在空间维度上,对于不同规模的数据中心,只需按需使用不同配置与不同数量的微模块。
数据中心的可靠性一直是业界最关注的话题,尤其对于金融、互联网等领域,无论是何种原因导致的数据中心业务中断都会给企业带来难以接受的巨大损失。智慧微模块的管理是自动化的,将人力解放的管理,依靠数字化技术颠覆传统部件监控模式,实现器件级精准管理,让设备可视、可监、可管,让数据中心更简单,让运维质量测点和标准更易懂。同时智慧微模块可以将人为的日常巡检、隐患预判断、健康度检查用传感器、执行器所替代,实现数据中心内环境、设备、部件、器件多个层次完善的状态获取,提前评估不同层级的健康状态,并在异常时提前发出告警,实现主动运维和及时备件更换,提升设备寿命进而大大改善整个系统的可靠性。
智能微模块创新性的提出了前瞻性运维的概念,对易损关键部件如电池、电容、空调风扇、水阀等进行实时监控,并形成健康度评估数据。以电池为例,通过监控电池的内阻、温度、电压、电流等关键数据,一旦发现数据变化超出正常工作范围,智能控制器就可以迅速响应,给出告警并采取隔离措施。除此之外,还会结合出厂特性参数、历史充放电数据、数据中心整网维护数据等相关数据,进行深度分析,见微知著,从细微的变化预测出可能存在的故障单体,并给出针对性预防措施。再比如UPS内部关键器件母线电容,可以通过实时在线的监测主动感知其健康度,避免突然失效导致设备宕机,将事后被动响应改为主动运维。
智能微模块结合传感器与大数据分析技术,将传统的故障维护变为了故障预测、前瞻性维护。这些措施将极大的提高数据中心可靠性。
智慧微模块同时能够提供高效运营,智慧数据中心的高效运营主要是实现三个最佳:最佳绿色数据中心,最佳资产管理以及最佳容量匹配。
智慧微模块管理系统能够帮助客户节能降耗,实现数据中心多层级、精细化能耗管理,通过多种报表精确定位能源额外损耗点,基于大数据分析,输出节能优化方案,构建绿色数据中心。以空调为例,传统模式下,数据中心单个精密空调都是通过自身的出/回风温湿度来判定如何工作,可以说是各自为政。智能微模块的所有空调都是由统一智能控制器作为“将军”,结合众多温度传感器构成的温湿度场情况来发布指令。少数厂商更甚一筹,通过智能微模块内部的温度传感器和服务器、存储自身获得的芯片温度叠加成“温湿度天网”,生成实时的温湿度场图。可精准定位潜在过冷/过热区域,精确制冷,完全避免加湿和除湿在不同位置同时运行的恶劣情况,据称同等硬件设施情况下可以再降低PUE0.07到0.15,对于我国大部分无法应用自然冷却技术的区域,将会是很大的福音。
在供电层面,智能微模块通过内置模块化UPS,结合IT业务量迅速匹配最佳供电效率点,UPS效率可持续保持在96%左右,而不会出现低载低效的情况。同时,智能微模块的集成智能控制器通过和IT设备层保持通讯,可手动或自动下达指令对运行业务进行必要的迁移,提升设备利用率,关闭部分区域空闲设备,最高可减少耗电80%以上。
最佳资产管理是对于全网资产的生命周期管理,从资产自动入库,到资产变更信息同步,再到资产日常维护,最后到资产生命周期结束,通过标准化的ITIL流程管理机制,实现资产信息的闭环管理,保证数据及时刷新,及时管理。同时基于设备生命周期的精确监控,帮助制定资产维护计划,在维护计划内帮助客户实现主动预警,在执行维护计划过程中,依靠大数据分析,动态调整维护计划,按照当前实际情况输出优化方案,构建最佳资产管理功能。
最佳容量匹配是对数据中心配电、制冷、空间的实时监控,从大楼级容量到机柜级容量,实现精确管理。通过历史运行数据分析,对实际需求进行准确估测,减少实际需求与潜在需求间的余量,实现电源、制冷与负载间的匹配。基于最佳机位匹配算法,全面考虑供电、散热、U空间、端口的匹配能力,使用what if的模拟测试方法,分析和测试发生变更可能产生的影响,从而已装机的供电、制冷系统中获得最佳的机柜供给,最大化的使用装机容量。智能微模块中,容量管理以实际的配置以及配置的变更为基础,通过测量、分析与评估,给出问题改进建议以及可用性分析报告,促进数据中心容量最优化部署。
智能微模块在传统微模块的基础上,融合了物联网、数字技术与信息技术,制冷、供电、结构系统从孤立无思想的部件变成有思想、统一可管理、通讯的智能部件,系统可视可管,并从基础设施、IT设施层多个层面进行综合分析和优化,相比传统数据中心确实更为简单、高效、可靠,有着极大的优势。
随着数据中心大型化、集中化的发展,传统数据中心由僵化的结构、低效的管理与运营,向具有数字化、网络化、智能化特征的智慧数据中心转变,以实现投资效益与运营效率的最大化,无疑是大势所趋。而笔者相信,智能微模块作为智慧数据中心的载体,正是实现这种美好转变的最佳选择,在未来的数据中心发展中也必将占据更加重要的地位。