谈数据中心供电系统运维技巧与心得

 
   | |

导读:数据中心供电系统运维保养的重要性不可忽视,维保人员肩上的担子很重。本文介绍了数据中心供电系统的运维目的及相关技巧与心得。

关键词:数据中心 数据中心供电系统 数据中心供电系统运维

 
正在加载数据...

  一、运维的目的

  数据中心供电系统的可靠性是至关重要的。可以想见,无论IT设备多么精密、系统的功能多么优越、可靠性多么高,一旦停电,再好的系统也无法运转。所以对运行中设备维护保养的重要性不可忽视,可见维保人员肩上的担子是很重的。

  二、运维的任务和无法解决的问题

  为了保障供电系统的可靠运行,有很多地方都制定了很多很好的措施。但即使如此也有很多漏洞。设备出厂后的可靠性就已确定,比如有的先天不足,像有的电源输出隔离变压器绕组用铝漆包线代替了电缆铜漆包线,在满载运行时十有八九是要出事的…不过由于设备本身的质量问题而导致的故障统计表明不足30%,70%的故障来自后天。也即是认为故障,其表现如下:

  1.选型不当导致的故障

  选型不当的原因有很多,主要表现在:

  • 基本概念不清,易受厂家误导。比如某高速公路招标UPS,在标书中要求UPS要具有输入断一相或两相后电池不放电,还能继续供电的能力。因为有的厂家标榜他的UPS在输入断一相后电池不放电,UPS还有50%的供电能力;输入断两相后电池仍不放电,UPS还有25%的供电能力,延长了电池的使用寿命。用户就认为这个性能好,稍动脑筋不难发现其弊病:若想享受其优点必须购买4倍于负载容量的UPS,否则断一相后就带不动当前的负载了。话又说回来,如果UPS断的是输入开关后面的两条线怎么办?还修不修?何时修?是否完全断电后才能修?等等这一系列问题如何解决。如果用户真的按负载世纪容量购买了这样的UPS,这就是莫大的隐患,这是靠运维解决不了的问题。
  • 不便说明的原因。比如有的用户从上个世纪就开始使用某品牌的机器,当时由于客观原因尽管输入功率因数低、效率低、体积大、耗电多和价格贵而无法也不便解决。现在比原来机型优越的多的新机型早已问世,比如新型的高频机结构UPS每一百千瓦每年要比原来工频机机结构的UPS节约5万度电,而这个几兆瓦容量的机房每年就可节约几百万度电。但由于某种原因,硬是放着节能设备不选而仍将那种耗能的机器写入标书,这样做还怕不保险,还把那种机器的结构特点写入标书。这不但增加了空调设备的投资和占地面积,无疑也为今后的运行埋下了隐患。这又是运维中无法解决的问题。
  • 追求低价格。有的用户认为UPS都一样,所以就追求低价格,结果导致故障。比如某高速公路指挥部贪图便宜,第一天装机,第二天就起火;某人寿保险公司低价格购进的机器,不到半年因UPS故障而烧毁几乎所有IT设备的输入电路,导致系统瘫痪;又如某多台UPS并联的兆瓦级数据中心,装机没有几个月因其中一台UPS中的一个逆变器功率管击穿而导致所有UPS跳闸……

  2.使用环境不当故障导致的故障

  不按说明书上对环境的要求放置机器,甚至有的将UPS放在随便穿行的走廊、滴水的地下室。比如几台200kVA的UPS放在了屋顶只有一层预制板的平房,空调只是两台5P的舒适空调机,又如一个玻璃厂竟将UPS放在粉末飞扬的厂房内,等等。导致了频繁故障。

  3.制度不健全导致的故障

  比如有的值班人员随便将电炉子、电饭煲和吸尘器接在UPS上,导致过载跳闸;有的值班人员的食物引来老鼠钻入机器而导致起火……

  4.交接故障

  这类故障主要是由于管理人员的前后不是一拨人或配合不好造成。比如某火车站售票系统,前面值机人员由于移动机器位置而将UPS的外接电池组断开,事后又未向后来者交代,结果造成了市电和UPS同时停电的故障……

  5.经验故障

  经验是不可缺少的,是不可多得的财富。但经验有其相对性,即在某种UPS上得到的经验不一定完全适合另一种UPS,否则就会导致故障。某电信局由于不看说明书而用同样的方法启动另一品牌机器导致逆变器烧毁。

  6.失察故障

  一些器件在运行中会出现老化或早期失效,如不及时检查发现就会导致故障。这些在自动监控中是无法发现的。比如因老化而开始弯曲的保险丝,电池结构螺丝的松动,电池长时间放点后使电池壳有微细的裂缝等,如不及时发现或发现后没有及时处理都可造成故障。

  7.仓促上阵导致的故障

  搞维修保养来不得半点急躁,要考虑周全后再动手。某公司工程师要对一用户正在运行的UPS进行检修,按照规定要用维修旁路开关将UPS退出后再检修,但按照程序需先启动自动旁路,而后再合维修旁路的闸刀。也许该工程是还有其他急事要办,进机房后未经考虑就闭合了维修旁路闸刀,结果造成逆变器功率管爆炸。

  8.维护不当导致的二次故障

  对UPS的定期维护是必要的,但应有一套严格的管理程序。那些不负责任、不按规定要求进行定期或不定期保养是导致机器故障的重要原因。另外,在维护保养时也可导致故障,比如用万用表探针测量电路板电位时,探针将两点短路导致故障。一用户作电池放电时,将电池从UPS上摘下,放电后将电池接回时机型解放,导致电流爆炸。

  又如一工程师在更换离心风机时不小心活动扳手一打滑打在了控制板上,当时没有在意,风机换好后不能开机,检查发现一条器件退被打断了……

  9.静电导致的故障

  某机房按例停机保养,但保养后却无法开机。检查后发现一个组件电压击穿,回忆为保过程发现该控制板用塑料牙刷扫过灰尘。塑料在干燥器件的表面可产生几千伏的摩擦静电电压,由于机器内小信号电路使用了一些MOS器件,这些器件耐压很低而且最怕静电。经测量一个普通塑料袋,用电路板摩擦以下就可产生3000V的静电电压。所以在检查这些电路板时最好手腕上要讨一个接地环。

  10.过分自信导致的故障

  做事情自信是成功的基础,但过分自信有时就会出错。比如某国际银行在UPS运行了8年后就应该更新设备,厂家也多次提醒。由于该UPS8年来很少出问题,所以用户负责人屡次回答“不用更新”,结构几个月后该UPS因老化故障而停止供电两小时,导致全球业务也中断两小时,损失很大。

  根据国际上的统计资料,5年标称的电池服务寿命最多不超过3年。在平时不保养的情况下,一般2年就应该更换。某飞机场候机厅电池原配4h,3年后不更换,一次外电网停电,UPS后备时间只剩4h,由于停电造成了损失……

  像类似的人为故障现象还有很多,就不一一例举了。

  归根到底,电源系统的选型是第一关,这一道关把不住首先就种下了隐患的种子。电源系统的连接是第二关,有了好的设备,如果没有好的连接方案,也会埋下隐患。某电视台由于连接方案被厂家误导。十几套节目的供电UPS故障接连不断,而且大都是有惊无险,一连几年都是这样,使维保人员提心吊胆、伤透了脑筋。连接方案是一个工程,不是维保人员左右的了的。无奈只好在重大活动和节日令厂家工程师前来值班。这又有什么用呢!厂家的工程师到此也只能是给用户心理上以安慰。该告警的时候照样告警,只求上帝保佑不要停电!


数据中心供电系统
 破解数据中心供电系统四大误区
 机房UPS供电系统设计方案探讨
 谈数据中心供电系统的运维
 谈数据中心供电系统运维技巧与心得
 APC为Switch通信集团提供高效能供电系统
 APC为全球最高密度数据中心提供高效能供电系统

原文出处:http://ndc.cnw.com.cn/news/htm2009/20090630_176761_4.shtml
 
来源:网界网    
 
 
 
 
 

信息系统管理

 
过去,智能手机一直是IT人士手中时尚的玩物。如今,随着3G网络的拓展,以Iphone为代表的智能手机变得普及起来。但是,又有几个人能够真正把这些功能利用起来?
 
Nimsoft公司位于加州Redwood市,是一家专注于MSP(管理服务商)市场的系统管理厂商,除此之外,他们还在企业级数据中心管理市场上占有一席之地。
 
过去在预算、风险投入和业务增长投资充足的情况下,要解决数据中心过度利用问题很简单,新建一个规模更大或是设备更先进的数据中心就可以了。而在如今的经济……
 
近日,业内传出微软有意收购数据中心自动化厂商Opalis的消息。众多IT工作站对此十分关注,此次收购对于广大用户而言究竟意味着什么?对其业务发展是好是坏?
 
在某些情况下,你可能需要自己动手编写简单对象访问协议(Simple Object Access Protocol,SOAP)消息头处理程序,在这篇教程中……

热门技术手册排行

 

当前,随着企业和社会数据量的不断增加,数据中心的规模不断扩大。伴随着数据集中在电子政务、企业信息化等领域的逐渐展开,以及基于Web的应用不断普及深入,新一代的企业级数据中心建设已成为行业信息化的新热点。虚拟化、云计算等新技术和概念的提出更是为数据中心的发展开辟了新的道路。但是,数据中心愈加壮大,对数据中心安全性的要求就愈加严格。而作为确保数据中心安全的一个重要方面,数据中心灾难恢复就显得尤为重要。作为数据中心管理人员,数据中心灾难恢复有何重要性?如何制定数据中心灾难恢复规划?虚拟化、重复数据删除等技术在灾难恢复中将起到什么作用?本专题将为你解答这些问题,对数据中心灾难恢复趋势与技巧进行分析。

 

近年来,随着企业和社会数据量的增加,原有的数据中心已无法满足数据处理的要求。许多企业在扩大原有数据中心规模的同时,开始引入新的数据中心规划与设计项目。而如今,在全行业打造绿色高效数据中心的大环境下,企业的数据中心管理人员如何选择数据中心设计团队及建设承包商?数据中心如何选址?城区数据中心有何规划和设计原则?数据中心与企业总部应该布局在一起还是分处两地?如何规划数据中心的容量?如何设计具有高成本效益的数据中心?本指南将为你解答这些问题,助你打造绿色高效数据中心。

 

数据中心TIA-942新标准已经出台将近一年了,10Gb的一些新标准也已公布或正在制定中。然而,无论采用什么标准,网络架构师和布线施工人员都必须想办法设计一个既节约能耗又符合成本效益的数据中心网络——并且还不能以牺牲性能为代价。那么,如何创建数据中心网络基础架构?数据中心网络设计过程中应该考虑哪些因素?如何确定数据中心的布线要求?如何补救数据中心电缆?数据中心布线成本如何计算?本手册将为您解答这些问题。

 

在数据中心普及化的高潮中,服务器整合与虚拟化是两个主要趋势。目前,许多机构都在实施数据中心整合策略,试图以此来降低IT成本并增加容量。许多人认为,更新的技术以及更少的数据中心必然会节省大量的运营成本。然而,数据中心整合项目究竟是否物有所值?数据中心整合项目实施过程中有哪些注意事项?在整合过程中有哪些常见问题,这些问题如何解决?本技术手册将为您解答这些问题。</P

 

如今,随着数据中心容量的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在加大。但是,无论如何,提高数据中心性能、降低数据中心能耗、降低数据中心运维成本始终是数据中心管理人员的终极目标。具体来讲,如何做好数据中心冷却?如何保证数据中心电源系统稳定高效的运行?如何对数据中心实现“绿色”运营?如何对数据中心网络进行监管,并保证数据中心的网络性能?这一切都是摆在数据中心管理人员的难题,本技术手册将对这些问题进行解答。

查看更多
 
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录