» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 17 12
发新话题
打印

[电脑] X86 VS ARM第二弹,I7秒ARM,ARM秒ATOM

十二核心ARM集群对阵Atom、IVB、APU2012-06-18 11:28:45 10803 人阅读 作者:上方文Q 编辑:上方文Q [复制链接] [我要爆料]
最近,Phoronix网站老大Michael Larabel尝试自己动手,组建了一套十二核心的ARM计算集群,总功耗还不到30W,而能效足以媲美Intel Atom、Ivy Bridge、AMD Fusion APU等平台。
这套系统的核心是PandaBoard ES开发样板,搭载德州仪器OMAP4460 SoC处理器,拥有两个Cortex-A9 1.2GHz处理器核心、PowerVR图形核心(其实集群里用不到它),还有1GB内存、百兆以太网卡、两个USB 2.0、HDMI、SDHC读卡器插槽。Ubuntu系统对OMAP4系列的支持非常好,这块板子自然如鱼得水。


六块PandaBoard ES组合在一起,就有了一套十二核心、12GB内存的ARM集群。每块板子零售价182美元,六块需要1000多美元,再加上六块16GB Class-10 SDHD存储卡、电源等等,总计大约1200美元。网络方面使用的是一个48口的企业级交换机,不过其功耗不计在列。
操作系统安装的是Ubuntu 12.04正式版,MPI集群配置使用MPICH2。Ubuntu 12.10因为拥有新内核,在OMAP4上的性能其实好很多,编译器也有大更新,但毕竟还处于测试阶段,和这套ARM集群存在一些配置方面的冲突问题,只能暂时使用12.04。如果能稳定运行12.10,性能将有两位数的提升。

系统可以通过USB接口供电,不过为了方便监测功耗而使用AC电源适配器。单独一块PandaBoard ES样板的负载功耗只有5-6W左右,整套系统只略微超过30W,待机时更是仅仅15W左右。除了低功耗,这套系统的另外一个好处就是完全静音。


【不同核心数量对比】
为了验证ARM集群的多核心扩展性能,先来考察1个、2个、4个、6个、8个、10个、12个核心的成绩。

第一项,核心越多性能越好,十二核心是单核心的10.47倍,很好。

10.07倍,也不错。

这样3D快速傅里叶变换测试就不行了,双核比单核提升了40%,再加入更多核心反而大幅倒退,十二核心还不到单核心的三分之一。

4.8倍看起来不是很高但也不错了,毕竟双核心比单核心提升仅为29%。

【十二核心ARM集群功耗、能效】
先来看一块板子、双核心下的情况。


空闲功耗平均3.9W、峰值4.2W



EP.C负载平均6.4W、峰值6.6W



EP.C性能与能效


LU.A负载功耗几乎完全同上



LU.A性能与能效


测试全程功耗记录:平均6.3W

接下来看六块板子、十二核心怎么样。


空闲功耗平均16.8W、峰值17.8W



EP.C负载功耗平均30.4W、峰值32.1W,不过波动稍大,最低的时候17.5W



EP.C性能与能效:比单块板子高出了11%(LU.A此时能效约为30Mop/sW)


【Atom 330系统】
参与对比的第一套系统是来自微星的Atom 330迷你机,1.6GHz双核心四线程,1GB内存,250GB三星硬盘,Mobility Radeon HD 4300显卡。机械硬盘对SD卡其实不太公平,但结果依然有参考价值。


空闲功耗稳定29W,已经赶上十二核心ARM集群的负载功耗了



EP.C负载功耗平均33.6W,比空闲时没增加多少



EP.C性能与能效:一块PandaBoard ES就是它的2.7倍了,六块十二核心更是整整3倍


LU.A负载功耗超过了36W



LU.A性能与能效:再次被ARM进群秒杀,还不到人家一块板子的三分之一


【Core i7-3770K系统】
第二套对比系统使用最高端的Ivy Bridge,3.5GHz四核心八线程搭配OCZ Vertex 3 240GB固态硬盘。性能肯定会强大很多,能效又如何呢?


空闲功耗41W左右



EP.C负载功耗平均107.8W,不过出现了一个小波谷




EP.C性能与能效:性能甩开ARM系统几条街,能效都要高出45%之多,而且别忘了这里还是有固态硬盘和其它配件耗着电的


LU.A负载功耗平均111.9W,不过出现了更大的波谷,最低41.5W




LU.A性能与能效:性能依然很强大,能效依然很高,达到了ARM系统的2.8倍



【E-350 APU系统】
1.6GHz双核心,Vertex 64GB固态硬盘,3GB内存。


空闲功耗高达38W,仅次于i7-3770K


EP.C负载功耗升至44.9W



EP.C性能与能效:跑得是比ARM系统快一倍多,但因为功耗偏高,能效就下来了,还不到ARM系统的三分之一


LU.A负载功耗进一步达到48.0W



LU.A性能与能效:比十二核心ARM集群还要快,但能效方面还是略逊一筹,只有人家的三分之二


【Atom Z530系统】
CompuLab Fit-PC2迷你机,1.6GHz双核心,1GB内存,160GB日立硬盘。


空闲功耗仅为8.5W



EP.C负载功耗平均也只有10.7W



(图中误为Z630)


EP.C性能与能效:相比Atom 330高效了一些,但还是只有ARM系统的一半

【总结】
PandaBoard ES无论性能还是能效都要比两个Intel Atom平台好得多,对比AMD E-350 APU也是拥有更高的能效,只是原始性能稍差一些。只可惜没有对比AMD Llano/Trinity APU。
Core i7-3770K彻底亮了:性能远远甩开ARM集群,能效也明显更高,而且一套最高端Ivy Bridge系统的成本也要大大低于一套十二核心的ARM集群。这足以说明,ARM要进军桌面乃至是服务器市场,挑战x86的地位,难度可想而知。
当然了,这里用的只是一套DIY ARM系统,不可能做到尽善尽美,专业服务器厂商打造起来肯定会更强大更高效,而且下一代64-bit ARMv8架构的表现也值得期待。
再者,等到Ubuntu 12.10系统完善之后,相信性能也会有明显的提升。其它考虑中的完善还有:改用高速NAS或者USB固态硬盘、系统内核调整、ARMv7编译器调整等等。期待后续……


TOP

posted by wap, platform: iPad

算能效比?GPGPU笑了



TOP

ARM为什么总要和x86挑战性能?
整数 浮点 这些?


TOP

GPGPU离了CPU也不能启动呗

说不定未来的超算就是ARM CPU+TESLA GPU

TOP

posted by wap, platform: iPad
引用:
原帖由 @hudihutian  于 2012-6-18 14:48 发表
GPGPU离了CPU也不能启动呗

说不定未来的超算就是ARM CPU+TESLA GPU
你就等黄老板的丹佛出来再吹也不迟。

TOP

看到宜家那个木头盘子架子,我就乐了,以至于后面都没看进去

TOP

引用:
原帖由 xx88 于 2012-6-18 14:53 发表
posted by wap, platform: iPad

你就等黄老板的丹佛出来再吹也不迟。
因特网他爹DARPA和硅谷他爹斯坦福大学不让黄老板爆尿啊,按黄老板的脾气,估计尿泡都要炸了

TOP

posted by wap, platform: iPad

那就看黄老板这泡尿能憋多久了

TOP

posted by wap, platform: Meizu (M9)

哈哈,有意思

TOP

posted by wap, platform: Opera

SD卡是什么速度的

TOP

别纠结SD卡了

这是12.04 LTS上的结果,如果用12.10来测试,ARM成绩还能凭空直升百分之二十左右

TOP

posted by wap, platform: iPad
引用:
原帖由 @hudihutian  于 2012-6-18 17:11 发表
别纠结SD卡了

这是12.04 LTS上的结果,如果用12.10来测试,ARM成绩还能凭空直升百分之二十左右
没有测试就凭你的嘴炮就提升20%成绩?

TOP

引用:
原帖由 xx88 于 2012-6-18 17:25 发表
posted by wap, platform: iPad

没有测试就凭你的嘴炮就提升20%成绩?
说人家嘴炮之前要谨慎

http://www.phoronix.com/scan.php ... 1210_arm1&num=2



Ubuntu 12.10 Sets To Make ARM Even StrongerPublished on June 06, 2012
Written by Michael Larabel
Page 2 of 7
Discuss This Article



The NASA Parallel Benchmarks were very surprise on Ubuntu 12.10. While Ubuntu 12.04 LTS upped the performance a great deal with its proper OMAP4460 support and built for hardfp, Ubuntu 12.10 advances the computational performance even more. Several of the NPB workloads were easily ~20% faster over Ubuntu 12.04 LTS from April. The most likely reason for this is GCC 4.7 over GCC 4.6.


TOP

ATOM顺序执行,性能还不如同频P3
12核VS2核+HT比性能赢了能代表什么呢?

TOP

引用:
原帖由 jinye2001 于 2012-6-18 17:31 发表
ATOM顺序执行,性能还不如同频P3
12核VS2核+HT比性能赢了能代表什么呢?
你再仔细看看再说

TOP

 17 12
发新话题
     
官方公众号及微博