国产龙芯3A3000处理器评测:与英特尔差距明显
3.fhourstones
解Connect-4游戏,测试处理器的整数性能。单核性能测试。
4。 gmpbench
用GMP 6.1.2数学库进行的性能测试。注意,gmpbench只考虑程序的整数性能,不是浮点性能。单核性能测试。https://gmplib、org/gmpbench、html
5。 minion
Minion是一个设计上具有可扩展性的开源约束求解器。单线程性能测试。
6。 mpcbench
GNU MPC是复数算术的C库。单线程性能测试。
multichase
This is a benchmark of Google‘s multichase pointer chaser program。单线程,多线程性能测试。
图6 FFTE、Fhourstone、Minion、Multichase性能测试
在以上的测试中,我们找到了两个关于J1900的测试数据,其中ffte性能仅相当于龙芯3A3000的2/3, fhourstone性能是龙芯的1.1倍。从总体性能上看,i5-7200U在以上的性能测试是龙芯3A3000的2倍到4.5倍不等,集中分布在2.3倍左右,我们预测龙芯3A4000的单核性能在这些测试中能达到i5-7200U的85%左右。i5-7200U在gmpbench和mpcbench中测试中性能是龙芯3A3000的4.5倍左右,优势明显,可能与数学库或者编译器的优化有关。
8 Bullet
Bullet物理引擎。 Bullet是一个开源的物理模拟计算引擎,世界三大物理模拟引擎之一。单线程性能测试。
9。 himeno
The Himeno benchmark is a linear solver of pressure Poisson using a point-Jacobi method。单线程性能测试。
10。 tscp
这是TSCP,Tom Kerrigan的简单国际象棋程序的性能测试,它有一个内置的性能基准。单线程性能测试。
图7 Bullet、Himeno和TSCP测试
在这一组测试中,i5-7200U优势非常明显,除了在国际象棋性能测试TSCP上速度是3A3000的3.6倍,在其他测试中速度基本都是龙芯3A3000的4倍以上,在bullet的ragdoll测试中性能甚至达到了龙芯3A3000的30倍。我们对bullet的代码进行了分析,发现其中有大量的SIMD相关的代码以及针对X86处理器的汇编语言优化。这是bullet在Intel处理器下运行速度快的重要原因。而针对Ragdoll测试,我们发现代码中有大量的三角函数运算,而龙芯目前三角函数的计算是有问题的,没有启用硬件浮点,而是使用的软件模拟,因此速度较慢。
11。 hpcg
高性能共轭梯度算法,由桑地亚国家实验室开发的面向超算的科学基准程序。多线程测试。
12。 npb
NPB,NAS并行基准,是美国国家航空航天局为高端计算机系统开发的基准。此测试配置文件目前使用MPI版本的NPB。多线程测试。
13。 n-queens
OpenMP版本的N-皇后问题解法器。问题大小是18。多核性能测试。
14。 mafft
100个丙酮酸脱羧酶序列的比对。多线程性能测试。
15。 primesieve
Primesieve使用高度优化的Eratosthenes筛法实现来产生素数。Primesieve对CPU L1/L2缓存性能进行基准测试。多线程性能测试。
图8 HCCG、NPB、N-Queens、MAFFT和Primesieve测试
以上的测试都是多线程的性能测试,HPCG测试中i5-7200U性能达到了龙芯3A3000的3.76倍。在NPB的测试中,龙芯在其中3项超过了J1900,另外两项不如J1900。在N-皇后问题、MAFFT以及素数筛选的测试中,i5-7200U性能是龙芯3A3000的两倍左右;如果龙芯3A4000性能能够达到3A3000的两倍,在这几个测试中龙芯3A4000将能够达到i5-7200U的性能。再次强调一下,这是多线程测试!
加密算法
16。 Botan
Botan是一个跨平台的C++的开源加密库,支持大多数的所有公开的加密算法。(单线程测试)
Gnupg
用GnuPG加密文件,统计耗时。单线程性能测试。
图9 Botan和Gnupg测试
在Botan测试中,龙芯3A3000在部分项目上与i5-7200U的差距在3倍左右。在AES的加密和解密这两个测试中,和i5-7200U有近80倍的性能差异!原因在于i5-7200U存在AES加密解密硬件实现,效率很高,而龙芯3A3000没有这样的功能,或者暂时无法使用该功能。此外,在Botan中同样存在针对X86的汇编优化,在能使用到这些优化的测试中,x86处理器就非常有优势。
多媒体编码
18~22。 encode-flac, encode-mp3, encode-ogg, encode-opus, encode-wavpack?
将音频文件转码为flac,mp3,ogg,opus和wavpack,统计所需时间。
espeak
这个测试需要花费多长时间的用espeak语音合成引擎读取古腾堡项目的The Outline of Science,并输出到WAV文件。单线程性能测试。
24。 dcraw
用DCRAW转换多个高分辨率RAW NEF图像文件到PPM图像格式,统计所需要的时间。单线程性能测试。
25。 mencoder
这个测试使用mplayer的mencoder编码器程序和LIVAVCODEC系列来测试系统的音频/视频编码性。单线程性能测试。
26.Vpxenc
这是一个标准的视频编码性能测试,使用谷歌的libvpx库和vpxenc命令实现VP8/WebM格式的编码。单核性能测试。
图10多媒体相关性能测试
在音视频压缩编码的测试中,龙芯再次完败于Intel处理器,不管是J1900还是i5-7200U。究其原因,还是在优化上。以上这些多媒体应用,针对x86处理器进行了大量的优化,而没有对龙芯处理器进行优化。
压缩算法
27。 Compress-7zip
用7zip程序自带的benchmark功能测试程序的多线程性能。
28。 Compress-gzip
用tar程序压缩Linux源码包,检验系统自带的gzip程序的单线程性能。
优化以后的gzip程序
- •Vishay推出的新款浪涌限流PTC热敏电阻可提高有源充放电电路性能2024-03-06
- •Cadence 推出全新数字孪生平台 Millennium Platform,提供超高性能和高能效比2024-02-02
- •Melexis推出新款微型3D磁力计,拓展性能极限2023-12-13
- •Qorvo 为 1.8 GHz DOCSIS 4.0 线缆应用带来出众性能2023-05-24
- •兆易创新推出GD32H737/757/759系列Cortex-M7内核超高性能MCU2023-05-11
- •明明可以靠实力 偏偏要靠颜值!影驰RTX 4070星曜OC评测2023-05-09
- •艾迈斯欧司朗推出新型光电二极管,为可穿戴设备生命体征监测应用提供出众性能2023-04-13
- •英特尔 13代酷睿 i9-13900KS 评测:出厂即达 6GHz,超频可破 6.3GHz!2023-02-02
- •SA:随着汽车摄像头需求增加,性能要求也在增加2022-12-15
- •索泰 RTX4090 天启 OC 评测,无惧 4K 光追,天启之力蓄满2022-11-28