如何在灾难发生后迅速恢复服务器运行

2009-5-18    来源:计世网    我要评论
   | |

导读:本文介绍如何在灾难发生后迅速恢复数据中心服务器的运行。

关键词:数据中心 灾难 服务器

 
正在加载数据...

  当2003年5月4日F4龙卷风袭击了位于田纳西州杰克逊的Aeneas互联网和电话公司的时候,这家公司的系统被龙卷风刮的凌乱不堪并且抛在了大街上。备份磁带在暴风雨袭击4天之后仍然不能恢复。然而,由于Aeneas有一个灾难恢复计划,这家公司所有的数千个客户在中断72小时之后都要恢复服务。不过,Aeneas似乎对于这个规定是一个例外。  

  PTS数据中心解决方案公司总裁Pete Sacco说,真正准备应付灾难的中小企业还不到20%。他们也许会说他们做了准备。这是一个漂亮的口号。如果老板询问,数据中心管理员将有一个“计划”。但是,在灾难袭来的时候,这个计划就崩溃了。

  在IT领域,保护你的服务器是非常重要的。当数据中心运行受到威胁或者停止运行并且服务器必须要尽快恢复运行的时候,你的选择是什么呢?

  根据等级容错

  服务器机房在发生灾难性事件的时候有三种基本的容错模式:热容错、闻容错和冷容错。热容错包含一个远程站点,能够在转换之后立即接管主数据中心。这个备份的站点储备着服务器、存储、通讯、备份能力等数据中心日常工作所需要的一切东西。还有一个连接到只要站点定期进行同步的安全的广域网连接。热站点服务器与主站点服务器并行运行,因此,当发生容错时,几乎不会出现关机时间。然而,热站点的供电和维护都是非常昂贵的。

  温容错有热容错站点的许多物理设备,但是,不是拥有全部设备。温容错站点有服务器机房转换所需要的全部硬件。然而,这些服务器不是每天24小时运行。因此,在下达容错指令的时候,一个温容错站点开始运行需要几分钟至几个小时的时间。企业也许喜欢与场地出租提供商签订合同作为保持一个热容错站点或者温容错站点的最节省成本的方式。此外,只要有硬件和房地产的消费,温容错设置仍然包括许多开销。

  冷容错是通过利用分支机构托管的非生产系统等现有的资源作为“权宜之计”的省钱的方法。当一家企业实施冷容错方案时,最新的备份数据必须要转送到冷容错站点,这比发送信息的站点要延迟1至2天,除非这个机构把那个分支机构作为自己的安全备份目标。不过,即使当前的数据在冷容错站点,现有的服务器一般都需要迁移自己当前的应用程序或者关闭这些应用程序以便为数据中心的应用程序让路。而且,因为这个分支机构的站点是一个备份的站点,其服务器很可能没有数据中心的服务器那样强大。如果容错时间太长,就可能引起问题。

  Integrity Computing公司总裁、企业顾问Ted Udelson说,采用服务器容错措施,你将有一个恢复时间目标和一个恢复点目标。你需要多长时间回复,你需要在哪一个点上恢复,意味着必须要达到的恢复水平。这将决定你将有一个热容错、温容错还是一个冷容错,以及为此计划的开销。

  Udelson说,如果你的机构没有合适的分支机构位置,与另一家公司签署一个互惠合同可以用于冷容错策略。他列举了一个非盈利贸易协会客户成功地利用与另一家公司签署的互惠合同的例子。如果发生灾难,每一个组织都可以利用对方的设施,将会的到6个办公室和足够的机架式服务器空间以便运行三个或者四个重要任务的服务器。这个机构每天都在这些重要服务器上进行备份,每一个月进行一次全面恢复。你可以把这种做法当作“不冷不热的容错”。

  更换设备的时间

  当发生故障的时候,你要立即更换你的服务器。但是,由于兼容性的原因,IT部门对于硬件组件要非常谨慎,甚至要强制规定具体的芯片和固件版本或者关键的组件。考虑到计算变化的速度,要能够保证使用兼容的系统进行更换也许要求厂商在合同期内储备某些额外数量的备份服务器。你必须要向厂商支付费用以保证这些储备,但是,支付的费用没有在你自己的库存中保持这些备份的设备那样昂贵。如果厂商是在本地,你可以规定更换的服务器必须要做几个小时之内提供给你的站点。你还可以要求在一旦在远程站点进行容错时优先通宵发货。

  还要注意这样的事实:你在灾难发生时联系关键人员的能力是决定你的服务器恢复速度有多快的主要因素之一。这不仅包括内部人员,而且还包括在恢复你的服务器运行中发挥关键作用的外部厂商。

  Forrester Research主要分析师Stephanie Balaouras说,企业要有一个需要联络的关键人员的手机号码表。在这组人员中,将有一个人负责灾难恢复。在这个计划中通常要有一个启动规定。系统需要离线几分钟或者几个小时。在这一点上,经过与需要提醒的人员进行一系列沟通之后,然后是一系列恢复步骤。例如,第一步,打电话、你的容错站点是谁、然后告诉他们你要来。第二步,给你的备份提供商打电话,让他们发出你的备份数据。

  如果大火在半夜摧毁了你的数据中心,你需要一家厂商具有每周7天每天24小时提供服务的能力。他们将在卡车上装载替换的服务器,早上第一件事就是给你运过去。你的厂商还应该拥有无懈可击的隐私最佳做法跟踪记录。在发送灾难之后,你的工作人员很可能不够用并且需要帮助,特别是在较小的企业中。

  好的厂商能够帮助IT部门让容错操作顺利地运行。但是,这可能需要处理你的数据。客户服务器厂商Amax信息技术公司产品营销经理James Huang指出,政府机构是非常严格的,从来不允许数据离开他们的网站或者由没有经过批准的外部机构处理。如果这适合你的恢复计划,你需要在灾难发生之前选择和批准少量的外部机构。这会在你的灾难恢复时间方面有很大的区别。

原文出处:http://server.ccw.com.cn/jssc/htm2009/20090515_626777.shtml
 
 
 
 
 
 

数据中心灾难防护

 
在经济紧缩时期,你如何制定投资于灾难恢复的案例?我们采访了灾难恢复服务的领导厂商,并请他们对需要证明灾难恢复方案价值的客户的提一些建议。
 
国际灾难恢复协会行政总监兼某大型金融机构前首席信息官Berman宣布信息技术灾难恢复将不复存在,这听起来似乎有点儿奇怪。但这不是否认灾难——他们还会发生。
 
灾难恢复就像是一个保险单。你需要确定你需要买多少保险,买什么险种,以及你会面临哪些风险?人们在购买保险时,总是在考虑自己的负担能力,而不是真正的需求。
 
从业时间较长的“老兵”们都知道,在IT行业理想与现实是有很大差距的。然而,谈到灾难恢复(DR),这种差距显得更加明显。灾难恢复更像是防范灾难的一种方案……
 
谈到灾难恢复,在如今这个信息爆炸的时代是不可缺少的,每年的信息量以50%的速度递增,但IT预算却没有跟上这个增长速度……

热门技术手册排行

 

当前,随着企业和社会数据量的不断增加,数据中心的规模不断扩大。伴随着数据集中在电子政务、企业信息化等领域的逐渐展开,以及基于Web的应用不断普及深入,新一代的企业级数据中心建设已成为行业信息化的新热点。虚拟化、云计算等新技术和概念的提出更是为数据中心的发展开辟了新的道路。但是,数据中心愈加壮大,对数据中心安全性的要求就愈加严格。而作为确保数据中心安全的一个重要方面,数据中心灾难恢复就显得尤为重要。作为数据中心管理人员,数据中心灾难恢复有何重要性?如何制定数据中心灾难恢复规划?虚拟化、重复数据删除等技术在灾难恢复中将起到什么作用?本专题将为你解答这些问题,对数据中心灾难恢复趋势与技巧进行分析。

 

近年来,随着企业和社会数据量的增加,原有的数据中心已无法满足数据处理的要求。许多企业在扩大原有数据中心规模的同时,开始引入新的数据中心规划与设计项目。而如今,在全行业打造绿色高效数据中心的大环境下,企业的数据中心管理人员如何选择数据中心设计团队及建设承包商?数据中心如何选址?城区数据中心有何规划和设计原则?数据中心与企业总部应该布局在一起还是分处两地?如何规划数据中心的容量?如何设计具有高成本效益的数据中心?本指南将为你解答这些问题,助你打造绿色高效数据中心。

 

数据中心TIA-942新标准已经出台将近一年了,10Gb的一些新标准也已公布或正在制定中。然而,无论采用什么标准,网络架构师和布线施工人员都必须想办法设计一个既节约能耗又符合成本效益的数据中心网络——并且还不能以牺牲性能为代价。那么,如何创建数据中心网络基础架构?数据中心网络设计过程中应该考虑哪些因素?如何确定数据中心的布线要求?如何补救数据中心电缆?数据中心布线成本如何计算?本手册将为您解答这些问题。

 

如今,随着数据中心容量的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在加大。但是,无论如何,提高数据中心性能、降低数据中心能耗、降低数据中心运维成本始终是数据中心管理人员的终极目标。具体来讲,如何做好数据中心冷却?如何保证数据中心电源系统稳定高效的运行?如何对数据中心实现“绿色”运营?如何对数据中心网络进行监管,并保证数据中心的网络性能?这一切都是摆在数据中心管理人员的难题,本技术手册将对这些问题进行解答。

 

在数据中心普及化的高潮中,服务器整合与虚拟化是两个主要趋势。目前,许多机构都在实施数据中心整合策略,试图以此来降低IT成本并增加容量。许多人认为,更新的技术以及更少的数据中心必然会节省大量的运营成本。然而,数据中心整合项目究竟是否物有所值?数据中心整合项目实施过程中有哪些注意事项?在整合过程中有哪些常见问题,这些问题如何解决?本技术手册将为您解答这些问题。</P

查看更多
 
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录