» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[转贴]几款热门CPU的真实浮点性能,自己看吧

楼上的,尽管乱序执行和SPE调度没有直接关系,但没有OOO直接导致整数性能残废,低效率的指令引擎必然会给SPE调度带来负面影响。
另外你说的没错,不支持OOO是为了给SPE腾地方~为了浮点,连现代CPU最基本的特点都可以不要了,IBM为了提高浮点能力,可以说的上是不顾一切~~
但问题是这强大的浮点能力在PS3上拿来干什么呢?CELL最开始规划是做几何处理和T&L,但目前的情况是图形部分由RSX包揽了,那CELL的这一堆SPE地位就有些尴尬了~能用的也就是物理运算的,但目前的游戏没有哪个需要用到这么多的物理运算的。


TOP

汗,啥时候整数性能跟乱序执行搭关系了。。。乱序执行是为了提高Instruction Level Parallel,SPE不光是没有乱序执行,连分支预测都没有。。一个branch乱跳就会刷流水线。。不过SPE的超大register file配合编译器优化(循环展开)一定程度上可以解决这些问题。毕竟SPE还是一个典型的向量执行单元,本来就不是为这种需要大量控制结构的程序优化的。
另外,楼上的好像有点误解是SPE执行浮点运算,PPE执行整数运算?这个理解是错误的。SPE是向量运算引擎,整数运算和浮点运算都是同样支持的,通常情况下PPE只是用来运行操作系统,以及如上面所说的,运行那些需要大量条件判断的代码。整数运算浮点运算都是SPE做,整数运算能力并不残废。
其实CELL的真正强的地方大概很多人都没有注意,是SPE里边那个256k的Local Store。正确的使用SPE的DMA引擎配合Local Store,CELL可以达到非常高的数据处理效率。



TOP

普通的整数运算程序通常包含大量LOAD/STORE指令和分支,如果没有OOO,在这种情况下,PPE的整数运算表现肯定会远远低于理论值~

至于SPE,如果处理那种并行度很高的整型运算,当然也行,但PS3上有这种运算的需求吗?在PS3上,SPE的主要工作,就是做物理运算吧,SPE确实是一个典型的向量单元。仅此而已。


TOP

PS3上的CELL官方证明是8spe的了吗?

TOP

along是cho? 说话风格好像

TOP

cxj3000在上个帖子中说
引用:
普通的整数运算程序通常包含大量LOAD/STORE指令和分支,如果没有OOO,在这种情况下,PPE的整数运算表现肯定会远远低于理论值~

至于SPE,如果处理那种并行度很高的整型运算,当然也行,但PS3上有这种运算的需求吗?在PS3上,SPE的主要工作,就是做物理运算吧,SPE确实是一个典型的向量单元。仅此而已。

有大量LOAD/SAVE的代码正好是SPE的强项,那个256k的Local Store + DMA非常有效。访问LS只需要几个CYCLE,而访问内存是要几百个CYCLE的。
SPE是一个向量单元,但是不是象楼上说的只做物理运算。这样子讲吧,SPE的向量运算引擎可以看作是一个加强了很多的Pentium里边的SSE或者AMD里边的3DNow。比如说MPEG4解码,象iDCT、MC等等都是PPE的强项,而VLD就难做了,因为里面会有很多分支的指令。

TOP

这贴给我一个感觉~
IBM的人都是SB,这么多简单的不能在简单的错误竟然都让Cell给占了~
世界第一大科技公司估计还不如TG里头的网友考虑的周全~
TG太强了~

TOP

along在上个帖子中说
引用:
cxj3000在上个帖子中说
引用:
普通的整数运算程序通常包含大量LOAD/STORE指令和分支,如果没有OOO,在这种情况下,PPE的整数运算表现肯定会远远低于理论值~

至于SPE,如果处理那种并行度很高的整型运算,当然也行,但PS3上有这种运算的需求吗?在PS3上,SPE的主要工作,就是做物理运算吧,SPE确实是一个典型的向量单元。仅此而已。

有大量LOAD/SAVE的代码正好是SPE的强项,那个256k的Local Store + DMA非常有效。访问LS只需要几个CYCLE,而访问内存是要几百个CYCLE的。
SPE是一个向量单元,但是不是象楼上说的只做物理运算。这样子讲吧,SPE的向量运算引擎可以看作是一个加强了很多的Pentium里边的SSE或者AMD里边的3DNow。比如说MPEG4解码,象iDCT、MC等等都是PPE的强项,而VLD就难做了,因为里面会有很多分支的指令。



SPE能分担一部分画面上的处理任务吗?比如和RSX一起共同进行模型的处理什么的?

TOP

mvmxvx在上个帖子中说
引用:
这贴给我一个感觉~
IBM的人都是SB,这么多简单的不能在简单的错误竟然都让Cell给占了~
世界第一大科技公司估计还不如TG里头的网友考虑的周全~
TG太强了~


不是IBM的人都是SB,是 s fan 都是sb。
ibm 不是神,不可能设计出 一款 像sony 描述的 既可以用在 飞机 大炮,又可以用在 洗衣机冰箱, 还可用在 手机,pda, 还还 可以用在 游戏机, 还还还 可以用在 电视机上。 又能 用好的 cpu。

TOP

along在上个帖子中说
引用:
楼上的,乱序执行跟SPE调度没关系的。PPE不支持乱序执行是为了降低PPE的复杂度,将更多的DIE SIZE用在SPE上。
不过上面的评测结果很对,双精度是CELL最大的弱点,这个跟当初设计CELL的初衷有关,最开始IBM做CELL的动机很简单,就是给PS3定制芯片。对于游戏来说单精度完全够用,所以CELL的架构是完全为单精度运算优化。
不过现在IBM的态度已经转变了,专门成立了部门开发基于CELL的下一代服务器平台,下一代的CELL也已经在开发中,将特别强化双精度运算以运用在科学计算、财经、医疗等领域。



从游戏角度说,浮点性能高低对于以前的主机是比较重要,因为以前很多3D运算都是由CPU承担. 为什么PS3采用CELL,索尼还是玩老一套,希望CPU来完成主要3D运算,没想到MS发布C1规格后索尼发现CELL相对太差了.这才赶紧找NV帮忙,怎奈时间已经不允许了,这才出现改个接口同时阉割版的7600. 所以两界E3的视频效果一天一地.

TOP

hdfeel在上个帖子中说
引用:
mvmxvx在上个帖子中说
引用:
这贴给我一个感觉~
IBM的人都是SB,这么多简单的不能在简单的错误竟然都让Cell给占了~
世界第一大科技公司估计还不如TG里头的网友考虑的周全~
TG太强了~


不是IBM的人都是SB,是 s fan 都是sb。
ibm 不是神,不可能设计出 一款 像sony 描述的 既可以用在 飞机 大炮,又可以用在 洗衣机冰箱, 还可用在 手机,pda, 还还 可以用在 游戏机, 还还还 可以用在 电视机上。 又能 用好的 cpu。


通用CELL我想是IBM要求的,当初索尼找IBM做PS3的CPU时,IBM就想借鸡生蛋.

就像当初MC68000 CPU一样,即是通讯使用的器件,也是MD主机的主CPU,又是数控机床的中心控制芯片.

记住,通用器件的好处就是能在很多地方使用,但是相对专用器件而言就差一些了.

你要是拆开音响设备,你会发现,凡是普及型的音响普遍都用LM358或OL084这样的通用运算放大器,但是你在HI FI或者专业音响里基本看不到这两个芯片,因为这两个芯片达不到要求.



TOP

计划中的CELL相对并不差

PS3原始设计是一个32 SPE的cell做CPU+32SPE做GPU,cell本身也是照这个目标开发的

最后 sony发现他们根本不可能完成这个设计,cell即无法达到即定目标又无法放弃不用,于是就出来一个残废cell+客串RSX的残疾怪胎出来

TOP

野蜂飞舞在上个帖子中说
引用:
along在上个帖子中说
引用:
楼上的,乱序执行跟SPE调度没关系的。PPE不支持乱序执行是为了降低PPE的复杂度,将更多的DIE SIZE用在SPE上。
不过上面的评测结果很对,双精度是CELL最大的弱点,这个跟当初设计CELL的初衷有关,最开始IBM做CELL的动机很简单,就是给PS3定制芯片。对于游戏来说单精度完全够用,所以CELL的架构是完全为单精度运算优化。
不过现在IBM的态度已经转变了,专门成立了部门开发基于CELL的下一代服务器平台,下一代的CELL也已经在开发中,将特别强化双精度运算以运用在科学计算、财经、医疗等领域。



从游戏角度说,浮点性能高低对于以前的主机是比较重要,因为以前很多3D运算都是由CPU承担. 为什么PS3采用CELL,索尼还是玩老一套,希望CPU来完成主要3D运算,没想到MS发布C1规格后索尼发现CELL相对太差了.这才赶紧找NV帮忙,怎奈时间已经不允许了,这才出现改个接口同时阉割版的7600. 所以两界E3的视频效果一天一地.




1,建议看看扣肉和同频率P4在游戏性能测试上的对比.看看帧数提高了多少.
2,敢情这24PS 8VS的550MHZ的7600是大神制造的吗?

TOP

stoneocean在上个帖子中说
引用:
计划中的CELL相对并不差

PS3原始设计是一个32 SPE的cell做CPU+32SPE做GPU,cell本身也是照这个目标开发的

最后 sony发现他们根本不可能完成这个设计,cell即无法达到即定目标又无法放弃不用,于是就出来一个残废cell+客串RSX的残疾怪胎出来


不是完不成设计,而是当前的制程无法用合适的成本和大小做出来这种东西

TOP

MJ3在上个帖子中说
引用:
stoneocean在上个帖子中说
引用:
计划中的CELL相对并不差

PS3原始设计是一个32 SPE的cell做CPU+32SPE做GPU,cell本身也是照这个目标开发的

最后 sony发现他们根本不可能完成这个设计,cell即无法达到即定目标又无法放弃不用,于是就出来一个残废cell+客串RSX的残疾怪胎出来


不是完不成设计,而是当前的制程无法用合适的成本和大小做出来这种东西


原来完成了设计了,那东西呢?

TOP

发新话题
     
官方公众号及微博