将IT变更管理作为灾难恢复的一部分

 
   | |

导读:数据显示,大多数数据中心灾难都人为原因导致的。这主要分为两种情况:一是缺乏精确的变更管理流程;二是在进行简单变更操作时忽略了对现有的管理流程。

关键词:数据中心灾难恢复 数据中心变更管理 变更管理流程

 
正在加载数据...

【TechTarget中国原创】数据显示,大多数数据中心灾难都人为原因导致的。在与许多数据中心经理交谈过程中,我发现这些人为因素主要分为两种情况:一是缺乏精确的变更管理流程;二是在进行简单变更操作时忽略了对现有的管理流程。

  这里我讲的并不全是那些飓风和暴风雪之类的大型灾难。我谈论的是打断数据中心正常业务运营、影响公司收入的所有事故。与IT员工或其它员工的认为因素相比,数据中心发生自然灾难的概率要小的多。数据中心灾难恢复规划需求具有一定的季节性,对美国企业来讲,8月份开始需求会上升,到11月份会有所减少,那时候大多数公司都已开始制定自己下一年度的预算规划了。从某种程度上讲,这与美国的飓风多发季节是保持一致的。

【TechTarget中国原创】数据显示,大多数数据中心灾难都人为原因导致的。在与许多数据中心经理交谈过程中,我发现这些人为因素主要分为两种情况:一是缺乏精确的变更管理流程;二是在进行简单变更操作时忽略了对现有的管理流程。

  这里我讲的并不全是那些飓风和暴风雪之类的大型灾难。我谈论的是打断数据中心正常业务运营、影响公司收入的所有事故。与IT员工或其它员工的认为因素相比,数据中心发生自然灾难的概率要小的多。数据中心灾难恢复规划需求具有一定的季节性,对美国企业来讲,8月份开始需求会上升,到11月份会有所减少,那时候大多数公司都已开始制定自己下一年度的预算规划了。从某种程度上讲,这与美国的飓风多发季节是保持一致的。

  而如今,在各家公司即将开始准备制定下一年度预算规划的前夕,我们来讨论一下数据中心如何减少自己的宕机时间。

  成熟的IT进程模式:CMM和ITIL

  能力成熟度模型(CMM)将IT软件的成熟度分为5个等级,第5级是最高的。要达到每一级都需要付出大量的努力,但由此获得的回报也是很可观的。而ITIL则为IT机构提供了一种定制需求、实现更高组织成熟度等级的框架模型。

  但是,让我们来看一下评估组织机构成熟度模型的现实情况。首先,这不是一个短暂的进程。多数机构升一个等级要花一年左右的时间。他们需要对员工进行相关培训,由于许多员工对于基础设施的变更都有抵制情绪,在这个过程中会有许多问题产生。不到他们自己亲身经历这些变更的时候他们是不会相信这些流程的价值的,更不用说去尽力支持了。此外,还有一些员工往往不愿意采用这些新的进程。这很不幸,这样的结果就是你将他们调整到其它位置或是将其解雇。大约一年前,我与一家致力于从CMM2级向3级晋升的公司有过接触,其副总裁拒绝部署变更流程,他认为这是一种额外的工作,没有什么价值所在。几个月后,我得知消息说公司解雇了这位副总裁并找人来代替了他的位置。

  通过部署进程和管理方案可以提高组织的成熟度,并减少IT变更管理中的错误,这就最终减少了数据中心灾难的发生。但是,永远没有一个方案可以完全解除人为的错误。有时候即使是一个很小的失误也会导致灾难的发生。

  即便是很小的变更也可能导致数据中心灾难发生

  Burton Group的研究发现,即使是一些很小的事情也可能导致IT机构陷入麻烦。具体情况如下:

  • 有的IT机构总是想寻找更高效的方式——最常见的做法是为了提高效率而对某些流程进行删减;
  • 某些小的配置变更进程似乎是可以被跳过的。通常企业会将一些看起来似乎不是很重要的变更流程省去,为的是提高业务速度;
  • 将一些可以跳过的进程提前完成;
  • 有些进程第一次这样做没有引起故障,但并不代表它永远不会发生故障;
  • 有的进程一旦第一次被跳过,那第二次也很可能被跳过;
  • 所有这些非正规操作的步骤都是IT系统故障发生的隐患,这些隐患随时可能导致数据中心灾难发生。

  要想提升IT进程成熟度,最基本的是要严格遵守各种既定的进程和流程,即使这些流程看似并不是很重要。这对于减少数据中心故障的发生是很有用的。

  是时候该提高IT进程的成熟度了

  金融危机为机构提供了一个改进IT进程成熟度的时机。在经济繁荣时期,IT机构将业务重点都放在尽可能快地构建IT基础设施和服务以支持业务增长上了。所有的CIO都明白IT进程应该为促进业务增长而服务,而不应该成为业务增长的绊脚石。就像我的一位同事所说的:“在经济繁荣时期,IT组织一直在以最快的速度为自己的‘业务机车’铺设轨道,而在经济危机时期,他们就有机会重新审视一下自己的基础架构和进程,来为提高效率而对其进行一些改进了。”

  如今,IT机构是时候该将他们的注意力更多地放在改进组织成熟度和效率上了,这对于降低数据中心灾难发生的人为原因来讲也是很关键的。

 
查看全文
 
 
 
 
 

数据中心灾难防护

 
谈到灾难恢复,在如今这个信息爆炸的时代是不可缺少的,每年的信息量以50%的速度递增,但IT预算却没有跟上这个增长速度……
 
在2009年,如果灾难恢复存在首要主题,它是尽可能减少成本。在这一年,当数十年来最严重的经济危机掩盖了任何理论上的灾害风险时,那些设法去执行或者提升……
 
一个牢固的灾难恢复计划能克服带宽和延迟问题,不会存在数据的丢失。在数据中心里,恢复数据和预防丢失的技术有很多种。虚拟化提供额外的好处,使你的架构……
 
在灾难恢复环境中使用虚拟化是个伟大的想法,过去,要从一台服务器复制到另一台服务器的成本是相当昂贵的,为保持两台服务器保持一致,它们的硬件配置需要一样。
 
服务器虚拟化正迅速成为许多组织灾难恢复(DR)策略中的一个关键组成部分,因为借助虚拟化技术的某些特殊功能,可以精简灾难恢复的过程。尽管如此……
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录