如何避免数据中心搬迁故障

2009-5-25   
   | |

导读:本文介绍如何避免数据中心搬迁故障的出现。

关键词:数据中心 数据中心搬迁 故障

 
正在加载数据...

【TechTarget中国原创】每个数据中心搬迁时的情况都有所不同,但其中大多数似乎至少会遇到一个共同的问题。无论该问题重要与否,都会导致项目延期、成本增加、以及对业务的其它不良影响。然而,对于大多数这样的问题,公司是可以预测甚至避免的。例如,在最近某Internet商业组织的一个数据中心迁移项目中,他们发现新楼的插座装错了。早在新数据中心设计阶段,公司就应该确定合适的插座。这一重要的问题使周末的搬迁项目停滞,直到公司找到电工更换插座(在搬迁进行了一半时)。

【TechTarget中国原创】每个数据中心搬迁时的情况都有所不同,但其中大多数似乎至少会遇到一个共同的问题。无论该问题重要与否,都会导致项目延期、成本增加、以及对业务的其它不良影响。然而,对于大多数这样的问题,公司是可以预测甚至避免的。

  例如,在最近某Internet商业组织的一个数据中心迁移项目中,他们发现新楼的插座装错了。早在新数据中心设计阶段,公司就应该确定合适的插座。这一重要的问题使周末的搬迁项目停滞,直到公司找到电工更换插座(在搬迁进行了一半时)。

  另一个案例中,有家公司贴错了光纤电缆的标签——最终导致新项目设备布线的错误,也会阻碍后续的故障排查。

  还有一个案例,一个电梯员由于其缺乏经验,使设备从高空跌落,导致设备被损坏,部件乱作一团。

  正如上述实例所显示,总是出现这些问题,很多数据中心的迁移项目难免会出错。当然公司最终会完成数据中心的迁移,只是会花费更多的成本,使业务的持续中断时间超过预期。

  为了使这些问题出现的几率降至最低,相关组织应该尽量避免五个可能阻碍数据中心迁移的常见错误。

  1. 没有全面地盘点设备:公司不知道从哪里开始或需要迁移哪些设备?
  2. 缺乏迁移项目设计:相关组织要确保目标空间适合新数据中心的运营。
  3. 缺少完整的数据中心迁移计划:相关组织没有指定详细计划,并依此分配职责或任务。
  4. 没有对重大风险进行鉴定也未制定合适的风险管理计划:相关组织之前应该假定会有问题发生并制定相应解决方案。
  5. 迁移计划缺乏执行力:人们往往不去恰当地执行相应计划,因为他们过于信赖经验不足的顾问和搬迁人员。

  数据中心搬迁项目失败的原因很多,但大多数是可以避免的。有一点可以确定:数据中心迁移有可能会造成数据丢失或业务中断,这很重要,会危害到关键业务的功能及其之间的联系。

  解决方法很简单:严格遵循项目迁移方案,对以上五个易犯的错误进行预判并采取最佳措施避开它们。只有那样才能保证数据中心迁移的成功。

  1. 知道从哪里开始。从准备全面审查目前数据中心的环境开始。在这个过程中应该识别并记载相关组织的技术和业务需求优先级。最后,你要确定数据中心关键服务,创建业务优先次序并识别任何约束数据中心重部署的计划和预算。
  2. 设计迁移策略。优先考虑业务服务,确立可接受的停机时间界限,确定无破环迁移的硬件、应用和技术需求。在这个阶段,组织机构也应该对潜在风险进行评估并准备临时计划来减少问题的出现。作为一个数据中心迁移服务提供商,Advanced Systems Group至少会准备三套迁移方案,只是为了以防万一。另外,迁移团队应该留意还未被迁移的电力和电信设施并将它们纳入计划进程中。
  3. 数据中心迁移规划。将迁移策略转换成一个行动规划,这包括完整的风险分析,详细的场地计划和机架图表等等因素在内,同时也要制定精确的任务并为每个人分配职责。最后,你还应该制作优先级矩阵图并绘制关键业务应用和资产间的关联图,还要对电信、电力供应、不同的技术供应商和外部专家提供的诸如设备搬运者、电工和HVAC的信息进行汇总分析。
  4. 设法降低风险。将所有以前经过鉴定的风险汇总然后对它们进行评估、分类并划分优先级,以达到降低风险的目的。最终你会明白,有些风险很小,不值得付出成本,有些风险则需要一个完整的临时风险降低计划,有些风险甚至可能要考虑到购买保险。
  5. 执行迁移计划。相关人员需要对分配给他们的任务负责。技术专家和专业系统搬运人员也应该参与进来。IT团队、供应商、外部专家和政府部门应互相配合,通力协作。

  几乎没有组织机构会完全独立地完成整个数据中心的迁移。原因只有一个,那就是他们必须像往常一样保持现有数据中心的运行——这通常需要全体员工的关注——直到搬迁完成的那天。技术专家,顾问和服务提供商可以在迁移过程中提供各个方面的帮助。

  数据中心迁移时保持业务的连续性是很重要的。如果企业遵循上述五个步骤,他们就可以在数据中心迁移中避免犯同样的错误。

 
查看全文
 
 
 
 
 

数据中心空间设计与选址

 
现在,越来越多的业务不仅拥有灾难恢复计划,而且正转向实现关键应用极少或零宕机时间的持续业务模型。对于许多业务来说,只是能够在48小时内从一个灾害中……
 
随着时间的推移,采用虚拟化的业务动因在不断变化,而“敏捷性”已经成为其中最主要的一个动因。通过实现快速应用开发和部署,以及快速的水平扩展,数据中心……
 
不管架构师在规划数据中心时所作的决策是什么,在十几年的周期后肯定会以某种方式被证明是错误的。事实上,避免错误的最佳方法是不作出无法变更的决策……
 
数据中心设计正在快速的变化,而网络架构师在选择和实现基础架构时也像是站在了十字路口。他们的短期和长期目标通常是相互冲突的,而且还需要应付大量流量……
 
普度大学采购的是一个40英尺的惠普POD产品,最多可支持1100个服务器内核,主要配置1U的HP DL165四处理器六核系统。新的计算资源主要是用来为新的“Rossman”……
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录