云计算:分布式网络服务可靠性分析

 
   | |

导读:Amazon一直是云计算的先行者,它建立的大规模平行网站式计算服务正为世界上越来越多的人所接受。

关键词:Amazon 云计算

 
正在加载数据...

  不久前,Amazon网络服务大规模的瘫痪事件招来了客户的大量批评和否定。紧接着,作为世界上最大托管存储商的Rackspace也出现了与Amazon类似的情况,同样惹得怨声载道。由于这两家的规模庞大,因此影响面甚广;又由于两者都采用了云计算的架构,所以人们在抱怨商家服务的同时,不禁怀疑起云计算的可靠性来。

    然而,正如任何系统一样,没有什么是完美的。当系统故障发生,沮丧的我们应该认识到这是生活的一部分。任何复杂如Amazon网络服务的系统,没有人能保证不会发生一点问题。正因为如此,单一、偶然发生的故障问题并不能衡量服务的质量。

    那么,云计算真的就不好么?事实当然并非如此,相反,它具有强大的生命力以及美好的前景。

  “云”与LAMP

    网络服务起源于L.A.M.P的组合(Linux、Apache、MySQL、Perl),直至今日依然强大有效,因此仍是许多流行网站的选择。LAMP贵在简洁之美,这使得上手非常容易。但它却存在扩展性差的问题:其一为Apache网站服务器的线程与scoket的连接少,因此当面临负载增加又未合理配置的情况时,网站的运转就有可能出现故障;其二就是MySQL的关系型数据库规模有限,因此成了整个系统最大的瓶颈,这个问题尤为突出。

    关系型数据库因为信息表征方式导致了容量的受限。并且,当达到一定规模时,管理还会变得困难。右下图明显可见,单一的关系型数据库与网络服务器间存在着明显的性能瓶颈以及单点失效的风险。为解决这一问题,一种名为数据分区的技术可以使关系型数据库的数据划分到N个独立集中去。如果这样行不通的话,唯一的方法就是放弃关系型数据库,改用分布式数据库,而这恰恰就进入了“云”的范畴。

云计算

  云计算的概念

    云计算的想法并不难理解,就是要将应用程序分散布置在由众多硬件盒组成的一个大型网格中。每个盒子内部系统相同,且规格均一。起平衡整个系统负载作用的负载均衡器发出的指令可以在各个盒间流水般无阻碍的通行,因此看似分散的盒子能运作如一体,迅速做出反应,宛如分散的小水滴在大气压作用下凝聚成一体终成浮动的白云,这就是“云”的概念。“云”之美还在于它的扩展性,你可以很容易地向“云”中添加更多的盒子。

云计算

    在上图中可以看出,计算云包括了三个最基本的组分:一个网站服务和应用层,一个分布式存储层,以及一个分布式队列层。每一个层都可作为“云”本身,也就是说层的每一组分在功能和结构上完全一致。在这最简单的模型中,web tier就当于LAMP中的bit概念,在“云”中,网络服务器同样可以采用Apache,同样可以运行应用程序的PHP代码,但与LAMP根本不同的是数据库不再是MySQL,而采用了分布式存储系统系统,如Amazon S3, Amazon SimpleDB或Amazon Dynamo。分布式队列层除了在无法实时操作的情况下需要外,并不是必须的。

    “云”最大的优势是它支持按需变化的运算商务模式。比如说,一个建立在“云”上的能支持1000~10000位客户的网络服务如果需要将客户容量提高到1000万,那么仅仅只需向“云”中添加盒子的数量。从商业前景来说,这是非常具有吸引力的,因为采用“云”之后很容易计算出系统扩展所需要的成本。

  云计算的现状

  “云”计算最好的例子无疑是Google。这个网络世界的巨头搭建和控制了数以百计、千计甚至于百万计的硬件盒,构成了一朵庞大的“云”。但为了应对不断增长的网络用户的服务请求,Google还在一刻不停地扩展着“云”的规模。

    当然,Google并不是唯一的实践者,而是几乎所有大型的网站包括Amazon、eBay、Yahoo!和Facebook都采用了各种形式的云计算。尤其是Amazon,凭借着它在分布式计算领域的领先地位,在过去的15年一直完善着这项技术,所以不难理解它要将未来的赌注压在垂直网站服务上。他们相信未来属于云计算,掌握了云计算的核心就掌握了生财之道,这一点上没人比他们做的更好。

  云计算的可靠性

    对于Amazon的服务崩溃,也许有业内人士会想:如果换成是我做的话,我一定能做的更好。这种设想一直存在于软件业的发展史中,如计算机语言种类的重复发明、API不断地推翻重写,我们总认为比前人更聪明、更富有创新性,但99.9%的事实证明我们是错的。所以说这次错不在于Amazon,在我们之前,他们已经投入了巨大的财力和人力来试图解决这些问题。大规模的运算服务是一个异常复杂和庞大的问题,即使对最具智慧和前途的工程师来说,也需花费数年来弄懂和解决它。

    就目前来说,搭建云计算平台可以通过独立设计和技术购买两种手段来实现。除非特定云计算结构需要独立设计外,大部分情况下,采用Amazon网络服务的云计算结构能满足需要。如果要击败对手,必须要明白和突出自己的产品的独特性,否则走重新设计的路线,你会发现你已失去时间和资源。

    也许Amazon服务崩溃不仅仅是“云”的问题,是否还应该考虑一下SLA(Service Level Agreements,服务品质协议)? 明明SLA上保证的是99.99%的网络服务可用率,可当服务使用3小时后就陷于瘫痪的情况该如何解释呢?我们应该知道,无论SLA上怎样的承诺,它不可能保证电力供应系统和“云”结构的完美无瑕地运作。

    所以我们不能盲目相信SLA,而是要动用自己的大脑。评价一个系统性能的稳定性不是看它是否会崩溃,而是预测它出现崩溃现象的频率。如果Amazon的网络服务一年内只有3小时的停工期,那么可以认为是完美无缺的;如果是每个月,那么就是不可接受的;如果是每天,那将是令人抓狂的。

  未来的发展

    Amazon事件不会影响它的网络服务计划,更不会阻碍云计算发展的步伐。Amazon一直是云计算的先行者,它建立的大规模平行网站式计算服务正为世界上越来越多的人所接受。我们有理由相信这仅仅只是云计算的开始,它正在从根本上改变着人类运算的方式。

    云计算解决了扩展性的问题,供应商们就能把精力集中到自己产品和服务中去。随着硬件成本、带宽和服务费用不断降低,云计算不再缥缈,而是触手可得,人类将乘着云计算来到了另一个天空。

原文出处:http://server.it168.com/a2008/0917/205/000000205315.shtml
 
来源:IT168    作者:小程    
 
 
 
 
 

云计算

 
过去在预算、风险投入和业务增长投资充足的情况下,要解决数据中心过度利用问题很简单,新建一个规模更大或是设备更先进的数据中心就可以了。而在如今的经济……
 
目前,大多数企业都面临着全球经济危机的困扰,数据中心行业面临着前所未有的压力,大型厂商重组、云计算来势汹汹……
 
近日,TechTarget中国数据中心网站记者就数据中心基础设施管理及云计算发展前景等问题对Avocent(中国)技术和服务部经理季晓文先生进行了采访。
 
Nimsoft最近发布了自己应用性能监测软件的最新版本——Unified Monitoring。这款软件可以帮助用户快速地弥补数据中心内部与云计算环境之间的监测盲区。
 
前不久随Novell(SLES)11发布的Mono扩展允许Visual Studio用户将他们用ASP.NET编写的Windows应用程序移植到SUSE Linux上运行,对此大家是不是有些困惑?

热门技术手册排行

 

当前,随着企业和社会数据量的不断增加,数据中心的规模不断扩大。伴随着数据集中在电子政务、企业信息化等领域的逐渐展开,以及基于Web的应用不断普及深入,新一代的企业级数据中心建设已成为行业信息化的新热点。虚拟化、云计算等新技术和概念的提出更是为数据中心的发展开辟了新的道路。但是,数据中心愈加壮大,对数据中心安全性的要求就愈加严格。而作为确保数据中心安全的一个重要方面,数据中心灾难恢复就显得尤为重要。作为数据中心管理人员,数据中心灾难恢复有何重要性?如何制定数据中心灾难恢复规划?虚拟化、重复数据删除等技术在灾难恢复中将起到什么作用?本专题将为你解答这些问题,对数据中心灾难恢复趋势与技巧进行分析。

 

近年来,随着企业和社会数据量的增加,原有的数据中心已无法满足数据处理的要求。许多企业在扩大原有数据中心规模的同时,开始引入新的数据中心规划与设计项目。而如今,在全行业打造绿色高效数据中心的大环境下,企业的数据中心管理人员如何选择数据中心设计团队及建设承包商?数据中心如何选址?城区数据中心有何规划和设计原则?数据中心与企业总部应该布局在一起还是分处两地?如何规划数据中心的容量?如何设计具有高成本效益的数据中心?本指南将为你解答这些问题,助你打造绿色高效数据中心。

 

数据中心TIA-942新标准已经出台将近一年了,10Gb的一些新标准也已公布或正在制定中。然而,无论采用什么标准,网络架构师和布线施工人员都必须想办法设计一个既节约能耗又符合成本效益的数据中心网络——并且还不能以牺牲性能为代价。那么,如何创建数据中心网络基础架构?数据中心网络设计过程中应该考虑哪些因素?如何确定数据中心的布线要求?如何补救数据中心电缆?数据中心布线成本如何计算?本手册将为您解答这些问题。

 

在数据中心普及化的高潮中,服务器整合与虚拟化是两个主要趋势。目前,许多机构都在实施数据中心整合策略,试图以此来降低IT成本并增加容量。许多人认为,更新的技术以及更少的数据中心必然会节省大量的运营成本。然而,数据中心整合项目究竟是否物有所值?数据中心整合项目实施过程中有哪些注意事项?在整合过程中有哪些常见问题,这些问题如何解决?本技术手册将为您解答这些问题。</P

 

如今,随着数据中心容量的增加、规模的扩大以及新型设备与技术的引入,数据中心运行与维护的难度也在加大。但是,无论如何,提高数据中心性能、降低数据中心能耗、降低数据中心运维成本始终是数据中心管理人员的终极目标。具体来讲,如何做好数据中心冷却?如何保证数据中心电源系统稳定高效的运行?如何对数据中心实现“绿色”运营?如何对数据中心网络进行监管,并保证数据中心的网络性能?这一切都是摆在数据中心管理人员的难题,本技术手册将对这些问题进行解答。

查看更多
 
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
登录Email
请输入您的登录Email
密码
下次自动登录