如何使用z10的CPU测量装置?

日期: 2010-10-10 作者:Robert Crawford翻译:黄永兵 来源:TechTarget中国 英文

IBM最近对z10的CPU测量装置(CPU Measurement Facility,C-MF)谈论得较多,C-MF能捕捉到许多与CPU相关的详细信息,可用于调试和性能测量,它由两部分组成:抽样和计算组件。   使用C-MF进行抽样   C-MF中的抽样组件看起来就象是软件性能抽样工具,如Strobe或TriTune的硬件版本,无论是硬件还是软件,其运作原理基本是相同的:定期记录程序状态字(Program Status Word,PSW)信息,在收集了数千份样本后,接下来对比保存的PSW指令地址和地址空间映射,以确定工作负载在哪里花费了大量的时间。   C-MF是在逻辑CP层实现的,在每个间隔……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

IBM最近对z10的CPU测量装置(CPU Measurement Facility,C-MF)谈论得较多,C-MF能捕捉到许多与CPU相关的详细信息,可用于调试和性能测量,它由两部分组成:抽样和计算组件。

  使用C-MF进行抽样

  C-MF中的抽样组件看起来就象是软件性能抽样工具,如Strobe或TriTune的硬件版本,无论是硬件还是软件,其运作原理基本是相同的:定期记录程序状态字(Program Status Word,PSW)信息,在收集了数千份样本后,接下来对比保存的PSW指令地址和地址空间映射,以确定工作负载在哪里花费了大量的时间。

  C-MF是在逻辑CP层实现的,在每个间隔期内,定义了一些时钟周期数,C-MF存储PSW指令地址,动态地址转换,问题状态,等待状态和地址空间控制位,在两个控制寄存器、表项地址寄存器和数据项地址寄存器的帮助下,信息进入一个链表的表项,当有数据块填充时,采样组件发出一个中断信号,这时信息将会在别的地方再保存一份。

  除上述基本信息外,如果需要,采样组件将保存“诊断”信息,IBM在诊断信息的组成上稍显模糊,往往只有模型依赖的警告。

  C-MF有两大不足之处,首先,有时捕捉到的指令地址是不确定的,其次,文档清楚地说明抽样并不适用于一般用途,它只是开放给IBM授权的技术人员使用的,IBM还警告我们要小心设置抽样间隔,因为设置不当可能会对性能造成重大影响。也许等到IBM能更好地控制抽样时,我们普通人才能用上它。

  CPU测量计数装置

  顾名思义,这个装置是用来保存处理器事件计数结果的,每个处理器都有许多全局和book范围事件的计数器,虽然根据型号不同,计数器的数量和类型也有所不一样,但始终会有一个特殊的寄存器提供计数器的版本号。

  1级(L1)版本包含下面这些计数器:

  • 基础计数器:这些计数器包含自上次抽样以来的时钟周期数,以及指令执行的总次数,此外,它们还包含了写入L1指令和数据缓存的次数,以及CPU等待数据提升至L1缓存的时钟周期数。
  • 问题状态计数器:它包含基础计数器的所有功能,此外,在处理器处于故障状态时,它会记录下故障事件。
  • 加密活动计数器:这些计数器记录不同类型的加密活动,它可以显示当加密引擎忙碌时,处理器等待的时长。
  • 扩展的计数器集:在撰写本文时,这套计数器是依赖模型的,在这个架构中未定义的,它是为将来发展预留的。

  在这些计数器上做一些数学运算,就可以产生一些有趣的数字,用周期除以指令数,就得到每个指令平均周期数,虽然这个数字不是立即可以发挥作用,但它用来衡量工作负载随时间推移的变化是一个不错的指标,它也可以证明相同的代码在不同时间,不同机器,或是否有其它代码在运行等条件下,其性能表现也是不一样的。

  L1缓存写入的水桶记录象征工作负载的存储引用位置,它现在是一个重要的性能指标,知道每个缓存写入操作使用的周期数,就可以计算出处理器等待数据所花时间的百分比。

  加密活动计数器可以提供处理的加密工作量,被阻止的周期数将表示加密引擎使用的趋势,当它们变得很繁忙时可以及时通知你。

  最终,所有信息都转储到系统管理工具(Systems Management Facility,SMF)以便于后期处理。

  IBM解释这些计数器只是一个估计值,它们可以勾勒出工作量,但不能准确描述是如何工作的,同时,IBM也警告我们要有节制地使用这个装置,因为它可能会引起性能问题。

  另一个问题是计数器的粒度,在处理器级别,没有什么具体的作业或任务驱动活动,如果某个特定的批处理作业运行很慢,那可能是因为L1缓存内的存储无法工作,或CICS事务的CPU上升,因为它使用了更长的记录。

  这两个C-MF组件让我们领略到大型机处理器诱人的优势,但至少在目前它们的用处是有限的。

作者

Robert Crawford
Robert Crawford

数据中心专家

相关推荐