虚拟机内存管理让IT专业人士很受伤

日期: 2010-03-04 作者:Mark Fontecchio翻译:黄永兵 来源:TechTarget中国 英文

IT专业人员说最新的x86处理器很受欢迎,主要是内存管理和虚拟化功能得到增强,但与此同时,他们也认为复杂性可能是一大挑战。   从芯片制造商到操作系统厂商,再到虚拟化软件供应商,他们都提供了优化内存管理的功能,在虚拟化数据中心中,这些功能是至关重要的,因为x86服务器利用率在不断攀升,在内存没有增加的情况下,越来越多的应用程序开始抢夺有限的内存资源。   还有一个问题是IT专业人员所承担的工作越来越多,越来越难跟踪数据中心出现的问题。   路易斯维尔市的一家非盈利组织的VMware管理员Kendrick Coleman说“我不仅是VMware管理员,我还是网络工程师,系统工程师,SAN管理员,……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

IT专业人员说最新的x86处理器很受欢迎,主要是内存管理和虚拟化功能得到增强,但与此同时,他们也认为复杂性可能是一大挑战。

  从芯片制造商到操作系统厂商,再到虚拟化软件供应商,他们都提供了优化内存管理的功能,在虚拟化数据中心中,这些功能是至关重要的,因为x86服务器利用率在不断攀升,在内存没有增加的情况下,越来越多的应用程序开始抢夺有限的内存资源。

  还有一个问题是IT专业人员所承担的工作越来越多,越来越难跟踪数据中心出现的问题。

  路易斯维尔市的一家非盈利组织的VMware管理员Kendrick Coleman说“我不仅是VMware管理员,我还是网络工程师,系统工程师,SAN管理员,同时还是安全管理员,总之我身兼数职,我每天不得不花大量的时间阅读与我工作相关的文章和博客,简直受不了”。

  虚拟机内存管理问题

  Coleman最近遇到了内存管理方面的问题,在x86处理器领域,趋势是在芯片中集成内存管理功能,英特尔至强5500或Nehalem系列处理器就具备这样的功能,AMD Opteron处理器使用了快速虚拟化索引(Rapid Virtualization Indexing,RVI)技术,但在这种硬件平台上运行VMware ESX服务器的部分IT专业人员遇到了内存分配问题。

  Coleman所在公司在两台IBM x3650 M2机架服务器上运行VMware ESX,该服务器装配的CPU是英特尔至强5530四核处理器,2.4 GHz Nehalem芯片,48GB内存,托管了11个虚拟机。

  Coleman报告了一些古怪的问题,如虚拟机的任务管理器显示只使用了530MB内存,但实际上已经为其分配了超过2.5GB的内存。

  Coleman说“好像我们的虚拟机不能完成TPS(透明页共享),TPS是VMware ESX的一个标准内存管理功能,正常情况下肯定是可以的,现在到了Nehalem芯片上就出问题了”。

  Coleman反应的情况并不罕见,VMware产品营销主管Eric Horschman在其社区中的一篇帖子中承认的确存在这样的问题(http://communities.vmware.com/thread/211585?start=0&tstart=0)。

  虚拟机内存问题是如何出现的?

  ESX hypervisor检查由运行在虚拟机中的客户机操作系统载入的内存页,当它找到相同的内存页时,它会保存一个副本,然后为虚拟机创建一个指针,指向这个副本,在高度虚拟化环境中重复内存页是很常见的,如果在同一台物理服务器上运行了20个Windows Server虚拟机,出现相同内存页的几率是相当高的。

  通过使用TPS,可以节省更多的物理服务器内存,这样就可以托管更多的虚拟机了。

  在老式处理器上安装ESX服务器时,ESX也会执行一些内存管理任务,但芯片中的内存管理功能是被释放给其它任务的,它可以使用更大的内存页,这样可以提高应用程序的性能,特别是数据库应用程序,如Oracle和SQL Server。

  如果服务器运行的虚拟机没有消耗完所有系统内存,TPS不会生效,因为只有少部分内存页时重复的,就不会出现Coleman报告的问题。

  但Horschman说随服务器内存消耗越来越接近其极限,ESX会切回到更小的内存页,以便TPS可以更有效地删除重复内存页。

  这个解释对Coleman非常有用,因为现从表面上看是内存问题,但他担心遇到应用程序性能问题,虽然到目前为止还没有出现过,但许多IT专业人士感觉仍然是个问题。

  Coleman说“也许该归咎于用户购买产品时没有了解其优缺点,但我们不能要求英特尔演示CPU,那么我们又如何知道呢?”

  究竟是一个问题还是一个bug?

  总部位于密歇根州的ProCare医疗管理公司的系统工程师Matthew Doak在vSphere 4.0中遭遇了类似的TPS问题,VMware的响应也让他非常失望。

  他说“我想他们最初低估了这个bug的影响,不但在vCenter中爆出了失败警告,甚至可能导致分布式资源调度器(DRS)将虚拟机移走,因为DRS可能会认为Nehalem物理主机上的内存已经消耗过度了”。ProCare最后根据VMware论坛中的建议有效地规避了这个问题。
 
  Doak建议所有从事虚拟化项目的人都应该仔细查看兼容性列表,确保硬件平台的支持性良好,Doak反复经历过升级到vSphere 4.0后主机崩溃的过程,最终他发现自己出了大丑,因为物理主机CPU根本就不受支持。

  他说“尽管使用ESX 3.5正常运行了一年多,但升级到4后不仅造成物理主机反复崩溃,而且其它主机通过Vmotion迁移到该主机上的虚拟机也跟着遭殃了,这几乎是一场噩梦”。无论这些问题是由bug引起的还是由因管理员未经培训引起的,在虚拟化问题上他们都噤若寒蝉。

  位于亚特兰大的房地产公司Place Properties购买了3台基于Nehalem的戴尔R710服务器,预装了ESX 4,Place Properties的系统支持经理Place Properties说“我经历过太多ESX内存问题,但现在更大的问题是公司管理层对VMware缺乏信任,我找不到有效的办法去说服他们”。

  尽管存在这些问题,象Raper 这样的IT专业人员并没有要求减少虚拟化和内存管理功能,他们只是想要更好的兼容性,更好的文档和技术支持。

  他说“虽然新的虚拟化技术增加了管理复杂度,但如果有一天它变得简单了,对于像我这样的人而言,虚拟化才会真正将我解放出来”。

相关推荐