国产龙芯3A3000处理器评测:与英特尔差距明显
2017年九月份龙芯俱乐部办了一个龙芯3A主板的团购。作为多年关注龙芯的爱好者,我参加了这次团购,购买了一个龙芯3A3000的主板。鉴于目前龙芯3A4000处理器即将流片,而目前对即将过气的龙芯3A3000处理器的性能并没有一个比较详细的评测,我使用phronix-test-suite对龙芯3A3000处理器做了一个尽可能理性、中立、客观、全面的评测,不吹不黑,不夸大成绩也不回避问题。
龙芯3A3000主板介绍
首先,还是晒晒图,回顾一下龙芯3A3000主板的模样。
图1龙芯3A3000主板照片,风扇下面是龙芯的CPU。另外两块散热片下面分别是南桥和北桥。
图2拆下风扇后,龙芯3A3000 CPU的近照,其中的LS3A3000D-LP意思是说这是一个低功耗版本的龙芯3A3000CPU
图3开机后BIOS中的信息,可以看到CPU的主频是1400MHZ,一级指令缓存64KB,一级数据缓存64KB,二级缓存4MB。
图4主板上的国产Unilc(西安紫光国芯半导体)内存条
我拿到的这块龙芯3A3000处理器不是性能最高的1.5GHz主频版本,而是性能略低的1.4GHz版本。因此,在估算龙芯3A3000(1.5GHz)的性能时,应该将我的测试结果乘以1.07。此外,需要说明的是龙芯3A3000笔记本里带的龙芯3A3000的主频被限制在了1.2GHZ。
拿到主板后,参照主板手册以及百度贴吧的手册,另外在龙芯俱乐部群和龙芯电脑用户和开发者群网友的帮助下,我装了一台龙芯3A3000的主机,并安装了Debian buster和Loongnix两个操作系统。
作为龙芯的老粉丝,我用过福珑6003的龙芯盒子以及8089D笔记本,两个机器都是用龙芯2F的处理器。从个人的体验上,使用龙芯2F的的图形界面只能说是“能用”,真正使用起来还是太慢。龙芯3A3000的性能和龙芯2F相比有了非常大的进步,不管是Loongnix还是Debian,在使用上都可以称得上是真正的流畅了。使用Firefox进行网页浏览,观看本地高清视频都都十分流畅。从用户体验上,龙芯3A3000已经完全可以满足办公、上网、听音乐、看视频这样的基本需求了。
龙芯3A3000处理器性能评测方案
和主流的x86处理器相比,龙芯3A3000究竟有多大差距呢?从性能上,龙芯3A 3000相当于哪一款CPU,即将流片的3A4000又相当与那个处理器?和其他国产处理器相比,龙芯3A3000的性能究竟是高还是低?
为了回答以上的问题,我使用phoronix test suite中提供的有关CPU性能的benchmark程序,对X270笔记本上的i5-7200U处理器和龙芯3A3000处理器进行了详尽的对比。此外,openbenchmarking网站上提供了很多不同处理器性能测试的结果,可以供人们更客观的评测系统的性能。
我在openbenchmarking网站上发现了飞腾1500A和飞腾2000+处理器的部分评测结果,在本次测试中也将对利用这些数据进行对比。作为参照,我又寻找了部分Intel J1900处理器的性能数据。
最近一段时间,兆芯处理器在性能上进步飞速,已经出了ZX-C、KX-5000以及KX-6000等多个系列的处理器,并且在网络上也有了一些测评,但在Openbenchmarking网站上我没有找到任何兆芯的最新处理器的踪迹,因此在本文中无法对比兆芯和龙芯的性能了。
为了比较两块CPU在相同主频下的性能差距,在测试中将Intel i5-7200U处理器的睿频模式关掉,去掉自动降频的电源管理,将频率锁定在2.5GHz。i5-7200U处理器最高可以睿频到3.1GHz,因此其实际峰值性能比本次测试时的数据的要高。
在测试中,我们同时关注处理器的单核性能和多核性能。最近,兆芯KX6000系列处理器在评测中根据7zip等多线程程序的测试结果,得出KX6000性能相当于i5-7400处理器的结论,但却有意无意的忽略了KX6000是8核8线程的处理器而i5-7400是4核4线程处理器。如果看单核性能,那么KX6000大致相当于i5-7400的一半。
下面是本测评中的多款处理器的基本情况对比。
Intel i5-7200U Intel J1900
龙芯3A 3000
测试使用的是7.8.0版本的phronix-test-suite。
测试分别在配备了Intel i5-7200U处理器的X270笔记本电脑以及自行组装的龙芯3A3000电脑上进行,其中对龙芯3A3000的测试在Debian testing系统上进行。测试环境如表2所示:
在测试过程中,我发现了疑似龙芯实验室使用1.5GHz的龙芯3A 3000处理器在Loognix系统上进行的部分测试结果。因此,我就不再单独使用Loongnix系统对该处理器的性能进行测试了。
对龙芯3A3000所使用的编译器选项,可以参考此链接
对部分应用,在编译时采用了n32的abi,即增加参数-mabi=n32。
由于CPU性能是我最想了解的东西,因此在测试过程中主要关心能反应CPU性能的测试,而不考虑对磁盘、显卡、内存等硬件的性能测试。
测试程序介绍及测试结果分析
科学计算
1。 scimark2
这个测试运行了SimiMark 2.0的ANSI C版本,它是由国家标准与技术研究所的程序员开发的科学和数值计算的基准。该测试由快速傅利叶变换、雅可比逐次超松弛、蒙特卡洛、稀疏矩阵乘法和密集LU矩阵分解基准构成。本测试为单核性能测试。
测试结果:
图5 Scimark2性能对比
测试结果如图5所示。在图中以龙芯3A3000(红色)的性能为基准(1.0),i5-7200U(蓝色)和J1900(绿色)的性能都与龙芯3A3000相比,数值越高性能越好。鉴于龙芯3A4000即将流片,根据龙芯方面放出的消息,龙芯3A4000相比3A3000同主频性能提高了30%,同时主频将从1.5GHz提高到2.0GHz。此外,龙芯3A4000还将增加256位SIMD指令,并将L3 cache从8MB增加到12MB,SPEC CPU2006的分值达到20分,达到龙芯3A3000的两倍。
因此,我们以将3A4000的性能设为2.0,作为性能预测的参考。
从图5的测试结果可以看出,在Scimark的Monte Carlo测试中,3A3000性能非常糟糕,只有i5-7200U的不到10%,甚至不到J1900的30%。这很不正常,可能有某个浮点运算没有使用硬件浮点,而使用了软件模拟的浮点运算。在其余的测试中,3A3000性能均与J1900相当,部分测试性能优于J1900。J1900和i5-7200U相比,虽然其主频也有1.99GHz,但单核性能只有i5-7200U的30%左右。
2.FFTE
FFTE是Daisuke Takahashi写的计算1、2和3维的序列长度为(2 ^ p)*(3 ^ q)*(5 ^ r)的离散傅立叶变换的一个包。单核性能测试。
- •Vishay的最新第四代600V E系列MOSFET器件的性能达到业内最佳水平2019-01-28
- •中兴通讯率先完成IMT2020三阶段核心网性能稳定性测试和安全功能测试2019-01-15
- •比预想的还要强!RTX 2060评测:GTX 1070 Ti都不是对手2019-01-14
- •德州仪器推出最小巧的数据转换器具备高集成度与高性能2018-12-05
- •诺基亚3.1Plus首发评测:好看的千元机百里挑一2018-12-04
- •AMD Zen 3处理器会上7nm EUV工艺 但别指望工艺性能大提升2018-11-27
- •性能快几十到几百倍,基于内存计算技术的人工智能芯片问世2018-11-19
- •AMD官方数据:Zen2单线程性能提升30%2018-11-13
- •DianNao系列的核心思想内涵在于不断追求智能处理最极致的性能2018-11-05
- •首款10GB内存手机!黑鲨游戏手机Helo首发评测:为手游而生2018-10-25