国产龙芯3A3000处理器评测:与英特尔差距明显

来源:IT之家 作者: 时间:2018-11-21 10:05

龙芯 性能 评测 龙芯 性能 评测 龙芯 性能 评测

  3.fhourstones

  解Connect-4游戏,测试处理器的整数性能。单核性能测试。

  4。 gmpbench

  用GMP 6.1.2数学库进行的性能测试。注意,gmpbench只考虑程序的整数性能,不是浮点性能。单核性能测试。https://gmplib、org/gmpbench、html

  5。 minion

  Minion是一个设计上具有可扩展性的开源约束求解器。单线程性能测试。

  6。 mpcbench

  GNU MPC是复数算术的C库。单线程性能测试。

  multichase

  This is a benchmark of Google‘s multichase pointer chaser program。单线程,多线程性能测试。


图6 FFTE、Fhourstone、Minion、Multichase性能测试

  在以上的测试中,我们找到了两个关于J1900的测试数据,其中ffte性能仅相当于龙芯3A3000的2/3, fhourstone性能是龙芯的1.1倍。从总体性能上看,i5-7200U在以上的性能测试是龙芯3A3000的2倍到4.5倍不等,集中分布在2.3倍左右,我们预测龙芯3A4000的单核性能在这些测试中能达到i5-7200U的85%左右。i5-7200U在gmpbench和mpcbench中测试中性能是龙芯3A3000的4.5倍左右,优势明显,可能与数学库或者编译器的优化有关。

  8 Bullet

  Bullet物理引擎。 Bullet是一个开源的物理模拟计算引擎,世界三大物理模拟引擎之一。单线程性能测试。

  9。 himeno

  The Himeno benchmark is a linear solver of pressure Poisson using a point-Jacobi method。单线程性能测试。

  10。 tscp

  这是TSCP,Tom Kerrigan的简单国际象棋程序的性能测试,它有一个内置的性能基准。单线程性能测试。


图7 Bullet、Himeno和TSCP测试

  在这一组测试中,i5-7200U优势非常明显,除了在国际象棋性能测试TSCP上速度是3A3000的3.6倍,在其他测试中速度基本都是龙芯3A3000的4倍以上,在bullet的ragdoll测试中性能甚至达到了龙芯3A3000的30倍。我们对bullet的代码进行了分析,发现其中有大量的SIMD相关的代码以及针对X86处理器的汇编语言优化。这是bullet在Intel处理器下运行速度快的重要原因。而针对Ragdoll测试,我们发现代码中有大量的三角函数运算,而龙芯目前三角函数的计算是有问题的,没有启用硬件浮点,而是使用的软件模拟,因此速度较慢。

  11。 hpcg

  高性能共轭梯度算法,由桑地亚国家实验室开发的面向超算的科学基准程序。多线程测试。

  12。 npb

  NPB,NAS并行基准,是美国国家航空航天局为高端计算机系统开发的基准。此测试配置文件目前使用MPI版本的NPB。多线程测试。

  13。 n-queens

  OpenMP版本的N-皇后问题解法器。问题大小是18。多核性能测试。

  14。 mafft

  100个丙酮酸脱羧酶序列的比对。多线程性能测试。

  15。 primesieve

  Primesieve使用高度优化的Eratosthenes筛法实现来产生素数。Primesieve对CPU L1/L2缓存性能进行基准测试。多线程性能测试。

图8 HCCG、NPB、N-Queens、MAFFT和Primesieve测试

  以上的测试都是多线程的性能测试,HPCG测试中i5-7200U性能达到了龙芯3A3000的3.76倍。在NPB的测试中,龙芯在其中3项超过了J1900,另外两项不如J1900。在N-皇后问题、MAFFT以及素数筛选的测试中,i5-7200U性能是龙芯3A3000的两倍左右;如果龙芯3A4000性能能够达到3A3000的两倍,在这几个测试中龙芯3A4000将能够达到i5-7200U的性能。再次强调一下,这是多线程测试!

  加密算法

  16。 Botan

  Botan是一个跨平台的C++的开源加密库,支持大多数的所有公开的加密算法。(单线程测试)

  Gnupg

  用GnuPG加密文件,统计耗时。单线程性能测试。

图9 Botan和Gnupg测试

  在Botan测试中,龙芯3A3000在部分项目上与i5-7200U的差距在3倍左右。在AES的加密和解密这两个测试中,和i5-7200U有近80倍的性能差异!原因在于i5-7200U存在AES加密解密硬件实现,效率很高,而龙芯3A3000没有这样的功能,或者暂时无法使用该功能。此外,在Botan中同样存在针对X86的汇编优化,在能使用到这些优化的测试中,x86处理器就非常有优势。

  多媒体编码

  18~22。 encode-flac, encode-mp3, encode-ogg, encode-opus, encode-wavpack?

  将音频文件转码为flac,mp3,ogg,opus和wavpack,统计所需时间。

  espeak

  这个测试需要花费多长时间的用espeak语音合成引擎读取古腾堡项目的The Outline of Science,并输出到WAV文件。单线程性能测试。

  24。 dcraw

  用DCRAW转换多个高分辨率RAW NEF图像文件到PPM图像格式,统计所需要的时间。单线程性能测试。

  25。 mencoder

  这个测试使用mplayer的mencoder编码器程序和LIVAVCODEC系列来测试系统的音频/视频编码性。单线程性能测试。

  26.Vpxenc

  这是一个标准的视频编码性能测试,使用谷歌的libvpx库和vpxenc命令实现VP8/WebM格式的编码。单核性能测试。

图10多媒体相关性能测试

  在音视频压缩编码的测试中,龙芯再次完败于Intel处理器,不管是J1900还是i5-7200U。究其原因,还是在优化上。以上这些多媒体应用,针对x86处理器进行了大量的优化,而没有对龙芯处理器进行优化。

  压缩算法

  27。 Compress-7zip

  用7zip程序自带的benchmark功能测试程序的多线程性能。

  28。 Compress-gzip

  用tar程序压缩Linux源码包,检验系统自带的gzip程序的单线程性能。

  优化以后的gzip程序


资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子