深入了解AMD推土机架构【Part2 服务器推土机】

作者&投稿:只郊 (若有异议请与网页底部的电邮联系)
~


深入探索AMD服务器推土机架构:解析与挑战

本文围绕AMD的推土机架构展开,从服务器专业评测的角度剖析,特别是针对Opteron处理器的进阶版本——"打桩机"(Abu Dhabi)和"interlagos"的比较,源于The Bulldozer Aftermath: Delving Even Deeper这篇权威文章。


尽管理论上提供了33%的性能提升,但"打桩机"在实际应用中的表现却令人失望。单线程性能和能耗问题引发了业界的热议,有人质疑AMD是否复制了奔腾四的困境,批评者则针对时钟性能和核心优化提出了疑问。


尽管AMD继续倚重推土机架构,但其架构问题引起了广泛的质疑。通过深入分析SAP和SPEC CPU2006等测试,我们可以窥见其中涉及的分支预测挑战,如错误处理机制的不足,这是一项亟待优化的难题。


批评者将推土机与奔腾四进行类比,指出其设计上的缺陷和性能瓶颈。以下是两者在关键特性上的对比:



  • 分支预测:推土机的错误惩罚较低(少于30周期),而奔腾四高达100+周期。相比之下,Sandy Bridge通过μop缓存减少了分支误预测。

  • 流水线设计:推土机的深度较Pentium 4(18级)浅,接近Intel Nehalem/Sandy Bridge(小于20级),影响了单线程性能。

  • 解码器:推土机共享解码器以节省功耗,但对单线程性能产生影响,通过预解码技术进行了X86融合优化。

  • 整数核心:推土机的灵活性使其在并行处理低IPC代码时更具优势,但整数指令吞吐量有所下降。

  • 瓶颈与并行性能:前端性能可能限制高IPC负载,但在轻度多线程游戏中,推土机仍有所提升。


总体来看,推土机架构在并行处理和能效优化上展现了一定价值,但牺牲了单线程性能。FX处理器在多核应用中的表现平平,游戏性能提升有限。在服务器领域,皓龙6200在一些场景下优于至强5600,但至强E5的加入导致了新的竞争格局,例如在VMware测试中的表现引发了讨论。


专业测试显示,皓龙6276在服务器任务如OLAP、虚拟化和渲染上并不如Magny-Cours,但在SAP和HPC测试中,有大约20%的性能提升。SAP S&D基准揭示,处理器在数据处理速度和乱序引擎性能上要求极高,而SNB的改进预取器使得它在SPEC2006整数测试中超越了Westmere。


尽管推土机整数核心有限,但通过预读取和乱序缓冲优化,预计在SAP性能上会优于Magny-Cours。然而,实际提升并未达到理论上的33%,AMD的承诺并未完全兑现,特别是对于SPEC2006整数测试,单核性能对比中E5的优势明显。


Libquantum、OMNETPP和MCF的性能提升超过了核心数量的增长,显示出推土机在IPC方面的优势。然而,Perlbench等测试中,33%核心数的增加未能弥补IPC下降,揭示了更深层次的问题。


尽管Libquantum得分显著提高,但与E5-2660之间仍有15%的差距。分支预测的局限性和优化,如预读取改进,是关键因素。MCF得益于内存优化,OMNETPP则因低分支误预测率而受益,但整体基准性能提升有限,甚至出现了倒退。


服务器应用的需求与桌面软件不同,推土机的初衷是为服务器优化,但在指令缓存、分支误预测和主频调校上面临挑战。尽管SNB在某些方面有所改进,但缓存设计和分支预测的深层次问题还需进一步观察。




宏碁新Chromebook用AMD推土机APU,为何老旧架构还在流行?
答:AMD虽然已全面转向Zen架构,但其推土机架构仍活跃在某些特定市场,如在Chromebook领域中备受青睐。例如,宏碁近日推出了一款名为Chromebook Spin 311 R721T的三防型新品。这款设备搭载了AMD的第七代APU,即A4-9120C,它基于推土机架构的改进版挖掘机设计。尽管这款处理器规格不高,但在Chromebook产品线中却...

介绍一下AMD推土机
答:赞比西河处理器定位于整机价格700美元以上市场,竞争对手直指Sandy Bridge架构的Core i7-2600、Core i5-2500系列,不过到年底的时候Intel又会拿出发烧级平台Sandy Bridge E,不知道AMD届时如何应付,仅仅是提升频率还是继续避其锋芒?根据AMD的产品转换计划,到今年年底的时候,推土机架构型号再桌面处理器总出货...

AMD推土机架构SuperPI补丁如何实现疯狂提速?
答:结论:芬兰玩家Stilt的神奇发现让推土机架构的SuperPI性能得到了显著提升。尽管SuperPI作为传统性能测试工具已显得过时,但Stilt通过深入研究AMD BIOS开发文档,找到了一个隐藏的性能瓶颈,创造出名为"Bulldozer Conditioner"的补丁,使得A10-6800K在低频率下运行速度反而加快了41秒,甚至在7GHz下,SuperPI成绩达到...

AMD推土机架构有什么优势?同AM3相比有什么质的提升?
答:最大的优势在于除了将核心数提升到八核以外推土机处理器将CPU的指令解码器由三发射增加到四发射,CPU处理指令的效率得到根本提升,之前AM3处理器都是三发射解码器,而现在英特尔i系列处理器都是四发射解码器,所以这也是为什么AM3的处理器单核性能总是与英特尔处理器差一截的原因之一 另外推土机对浮点运算...

AMD 推土机CPU是什么意思 AMD推土机架构CPU上市时间?
答:推土机是AMD最新一代CPU的微架构代号 去年年底发布的 已经在卖了 但是性价比不高 FM1是APU的接口标准 属于Llano系列

AMD推土机是什么呢
答:AMD的Bulldozer(推土机)处理器,应该是八核心的 支持AMD的Bulldozer处理器的AMD 900系列芯片组主板将于今年第二季度面世,届时将会跟Bulldozer处理器、AMD HD 6000系列显卡共同组建Scorpius(天蝎座)平台,最后,AMD希望在2011年底,Bulldozer处理器能够占据自身市场的10%。■ ...

amd的推土机与打桩机有什么区别?
答:是AMD的APU架构 你可以理解为推土机为强大的流水线排慢慢推进并排做工 四核四流水线同出 打桩机则是两边翘型的,4核心 2显卡处理器都是各分2个流,当处理CPU性能时候分担CPU加速,当显卡GPU需求游戏处理量大时候 这偏向显示处理的GPU这边加速高,这样性能完备些 打比方,我有2个卡车司机日夜开车(其中...

AMD推土机架构有什么优势?同AM3相比有什么质的提升?
答:最大的 优势 在于除了将 核心 数提升到八核以外 推土机处理器 将CPU的指令 解码器 由三发射增加到四发射,CPU处理指令的 效率 得到根本提升,之前AM3处理器都是三发射解码器,而现在 英特尔 i系列处理器都是四发射解码器,所以这也是为什么AM3的处理器单核性能总是与英特尔处理器差一截的原因之一 另...

哪位大神介绍一下 AMD 推土机和 APU?越详细越好
答:1 以前,amd使用错位竞争Phenom,Athlon,Sempron 让对手不容易发布竞争产品。这样amd 就缺少像i7-990x 995x这样全能的cpu。AMD推土机采用新架构要在这一年改变产品线。2. AMD推土机价格与i7丝毫不差 amd fx-8130p千颗单价大约320美元。所以性能绝对不差。am3+不与am3兼容 fx-8170(p)---...

请问AMD新推出的推土机和APU有什么区别?
答:APU是把CPU和入门级GPU整合在一块硅晶片上,CPU部分的价格是老的K10架构优化后的K10.5架构,删去三级缓存,而GPU则是完整的,而且支持dx11,集成显卡部分很给力,两者共用一个内存控制器,内存最好搭配ddr3 1860的,才能发挥出性能。而推土机是AMD最新的CPU架构代号,三级缓存为8M,两个核心为一个模块...