AMD Barton核心CPU测试报告

来源:《中国电脑教育报》 作者: 时间:2003-03-03 22:08

      (华强电子世界网讯) 在Athlon 64发布之前,为了抵挡Intel的攻势,AMD的Athlon XP引进了新的元素,代码名为Barton,这种新芯片的缓存是原来的两倍,从256KB跳升到512KB。其他的参数没有变化。这样既提高了芯片的性能,又不会带来任何的副作用。这种性能的提高其实我们在Intel发布Northwood的时候已经看到过,自Northwood发布以来,P4的性能平衡了很多。下面我们就逐步介绍这款新的芯片。
    
    

认识Barton家族

    
      由于使用了更大的缓存,Barton的体积要比Thoroughbred(以下简称T-bred)的大(见图1)。T-bred由3760万个晶体管组成,而Barton则由5430万个晶体管组成。P4的Northwood由5500万个晶体管组成,所以Athlon XP的晶体管的数量最终和P4的一样。在体积方面,Barton只比T-bred长一点,Barton的表面积由原来的84mm2增加到101mm2。因为现在缓存的晶体管可以被封装在较小的空间里面,所以Barton的体积不会特别大。
    
      所有Athlon的芯片都带有128KB的一级缓存,平均地分配作为指令缓存和数据缓存。因为Athlon的二级缓存是独立于一级缓存的,二级缓存的内容和一级缓存的内容并不重复。所以,Athlon有效总缓存比P4的大。Athlon的T-bred核心的128KB一级缓存和256KB二级缓存加起来达到384KB片内缓存。同样的,Barton的两片64KB一级缓存和512KB二级缓存加起来有效缓存达640KB。
    
图1

      但是,光是缓存一个参数并不能说明任何的东西。我们不能只凭Athlon XP的缓存比P4的缓存大就得出谁比谁性能更好的结论。因为Athlon XP和P4毕竟还有很多方面不一样。
    
      64位2.17GHz的二级缓存提供5.5GB/s的带宽给CPU的内核,比3GHz的P4处理器小了不少。但是,如果说Athlon的二级缓存的速度影响了性能还是言之过早。和P4相反,Athlon的一级缓存会提供很多需要的带宽资源。比如,一个浮点运算程序有85%在一级缓存中,但是只有15%在二级缓存中。由于P4只使用它的二级缓存,所以对于浮点数运算单元它有19GB/s的带宽量。而Athlon则有(0.85×19 GB/s + 0.15×5.5 GB/s) 17GB/s的带宽量,二者旗鼓相当。在大多数的应用程序中,特别是浮点运算中,Athlon使用二级缓存的频率比P4要少。
    
      于是我们可以理论上推测:Barton?640KB?和Thoroughbred?384KB?的性能差要比Northwood?512KB?和Willamette?256KB?的性能差要小。
    
    
混乱的产品线

    
      我们今天说的Barton芯片是指Athlon XP 3000+。尽管它的时钟频率只是2.166GHz,但是因为Barton核心的缓存比T-bred多,所以它的型号为“3000+”。同样频率的T-bred只得到Athlon XP2700+的编号。这种编排的方法使得AMD原来清楚的排序变得混乱。
    
      真正造成这种混乱的是Athlon XP 2800+。AMD去年十月份发布了2.25GHz基于T-bred的芯片,但它没有被广泛的使用。现在,基于T-bred的Athlon XP2800+已经被基于Barton的Athlon XP2800+所取代了,后者的时钟频率仅为2.083GHz。AMD说基于T-bred的Athlon XP2800+只是一个限量生产的产品,现在已经不再生产了。
    
      在Barton家族中,最便宜的要算Athlon XP2500+了,它的时钟是1.83GHz。AMD曾经发布了Athlon XP 2400+和2600+两款基于T-bred的处理器,但是它们有更高的时钟。和所有Barton一样,Athlon XP2500+在333MHz前端总线的环境下运行。(顺便提醒大家,AMD说将会考虑让芯片运行在400MHz前端总线的环境下。AMD有可能会在年中发布的Athlon XP3200+中使用更高速度的总线)
    
      基于Barton的芯片,像Athlon XP3000+,将不会像以前的Athlon XP那么便宜,因为AMD想凭借Barton拉近Athlon和P4之间价格的差距,并靠Barton来填补AMD在高端市场的空白。
    
      当然,只有通过基准测试才会知道这些芯片是否物有所值。现在先让我们看一看Barton和T-bred芯片的真面目。
    
    
测试结果

    
      内存性能:
    
      像以往一样,我们将以内存测试开始,它可以说明缓存不同导致Barton和T-bred性能的差别。这个测试也可以告诉我们处理器和内存子系统是如何共同合作传递数据的,这是我们了解系统性能的一个关键的步骤。但经验告诉我们,内存测试是不可能说明整个系统的性能的。
    
      Sandra的带宽测试为总的内存带宽建立了一个非常清晰的层次结构。P4的RDRAM系统成绩最佳,而P4的DDR333系统则比Athlon的成绩稍好一点。由于这个测试是针对主存的,所以Barton额外增加的缓存没有发挥作用。Athlon XP系统的表现不佳是由于他们的前端总线只有333MHz,它的最高带宽仅是2.7GB/s。
    
      Linpack测试向我们显示了Barton和以前的Athlon XP有什么不一样。Barton芯片的表现一直很好,直到matrix的值上升到512KB。
    
      T-bred的MFLOP值在matrix上升到300KB左右就开始往下掉了。由于频率较高,所以Athlon XP在数据量较小时,最佳的表现比Athlon XP2800+芯片好。
    
    
测试平台表

    
 
    
产品资料表

    

    
      Cachemem测试向我们提供了类似图像,RDRAM读入和取出大量的数据,拥有惊人的带宽。使用同样的内存子系统,不同的Athlon XP芯片的性能没有太大的变化。
    
      现在,我们往下看看更一般的应用程序的基准测试。
    
      Business Winstone
    
      这个普通的办公软件充分显示了Barton的二级缓存的作用。Athlon XP 2600+(T-bred)和2800+(Barton) 这两款芯片的时钟频率是一样的,都是2.083GHz,它们只有缓存的大小是不同的。从测试结果就可以看到,在Business Winstone软件的运行过程中,256K缓存使性能提高了3%。在这个测试中,P4的表现没有Athlon XP好,但好像一直以来这项测试都不是P4的强项。
    
      Content Creation Winstone
    
      经过考虑,我们决定使用三个版本ZD的Content Creation Winstone进行测试。当你看到结果时你就会明白这样做的用意。
    
      随着时间的推移,CC Winstone也积极的更新换代它的应用程序,增加了更多的视频处理和使用更大的数据资料。在2003年增加了Newtek’s Lightwave 7.5 renderer,专门优化了对P4的SSE2的支持,但对SSE和3DNow!(Athlon XP都支持)这两项扩充指令就不起作用。认识了这点,你就很容易知道,这款软件更新换代的结果是什么。所以我们觉得对这三个版本都进行测试是最好的方法。我们将对多个CC Winstone的子功能进行单独的测试,以便在更具体的应用程序中对AMD和Intel的产品进行比较。
    
      LAME MP3 encoding
    
      我们使用LAME 3.92来把一个101MB 的16bit、44kHz的声音文件解码成一个高质量的MP3文件。我们使用的命令行是:
    
      lame --alt-preset extreme file.wav file.mp3
    
      在这次测试中,P4又再次领先。Barton增加的缓存好像对LAME的解码并没有实际的帮助。最快的Athlon处理器是2.25GHz的T-bred,它有最快的时钟频率。T-bred 2600+和Barton 2800+有相同的时钟频率,它们的解码速度也一样的快。
    
      DivX video encoding
    
      在这个测试中,我们将使用一个279MB的视频文件,以MPEG2编码,格式化为DVD,我们将把它转换成一个33MB的DivX文件。我们使用DivX解码器的“medium”质量/速度 设置,而且我们关掉声音处理的所有过程。另外,其他的设置都保留默认值。
    
      一直以来P4在编解码方面都有不俗的表现,今天也不例外。这次测试中,Athlon XP系列处理器二级缓存优势还是没有显现出来,反而是时钟频率最高的2800+表现最好。在这你也可以看到P4超线程的优越性。加了一个逻辑处理单元的P4处理器使得解码时间减少了半分钟。
    
      QuakeⅢ
    
      虽然Athlon XP 3000+在运行Quake Ⅲ时与P4相比还是有一定差距,但是它的表现还是Athlon XP里面最好的。要说明的是,我们在测试中没有使用“r_smp 1”的超线程设置。
    
      3Dmark2001 SE
    
      在3Dmark的测试中,AMD和Intel斗得很激烈,但最后还是P4略胜一筹。超线程加上RDRAM帮助它扩大了优势。
    
      Unreal Tournament 2003
    
      这次测试中,AMD的处理器显示了其应有的本事。Unreal Tournament对Barton的缓存的依赖多于对高频率的依赖,而Athlon XP的处理器基本比相对应的P4处理器表现更佳。超线程和RDRAM起到一定的帮助,但它们的力量不足以让P4在此次测试中胜出。
    [page]
    
结 论

    
      我们认为更大的缓存无疑是一个不错的改进,但是更高的时钟频率和更快的系统总线也不可忽视,尤其是针对Athlon XP系列CPU而言。
    
      测试结果告诉我们,要看哪款芯片表现最佳,不仅要看运行的是什么应用程序,而且还要看应用程序的版本是新还是旧。P4在某些应用程序的新版本中的表现很好,因为这些应用程序都针对P4进行了优化。但P4在某些旧版本中的表现就不太好。同时,当应用程序需要很多的内存和很大的带宽时,P4的表现也非常的出色。而由于CPU的缘故,Athlon XP在集中的整型数运算或浮点数运算较多的应用程序中表现要更好。Barton 核心新增的缓存使这种趋势显得更加明显,Barton芯片在Business Winstone测试中大获全胜就说明问题。但问题是,现在的软件都日趋支持SSE/SSE2和超线程,然而Athlon却不能从中获益。如果谁要在P4和Athlon XP之间做出选择的话,那就要问问自己,究竟自己要做什么,照方抓药办才对。
    
      在部分应用中性能不错
    
      初期价格难以接受不错
    

    

    

    

    

    

    

    [center][upload=]4464_960844.j

相关文章

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子