» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] PSV【Unit 13 】最新画面(11月23日)

引用:
原帖由 u571 于 2011-11-23 12:07 发表
543MP4浮点shader性能连RSX十分之一都没有,RSX的十分之一能做什么特效?
像素运算不一定非要用单精度浮点啊。不少情况下使用半精度(FP16)就能凑合。而如果乐意退化到DX8(FX10精度)级别的话,那么PSV的pixel shader性能就还算可观了,至少比同是DX8级别的XBOX要强上不少。
总而言之,543MP4的shader合理用法就是,Vertex Shader大部分单精度(FP32)其中可以掺杂一些半精度运算。而Pixel shader则是半精度(FP16)掺杂定点数精度(FX10)运算。这样的话shader性能虽然依然远不及RSX,但考虑到分辨率较小与极佳的Early Reject特性,也不能算极其捉襟见肘。


TOP

引用:
原帖由 JimmyC 于 2011-11-23 13:35 发表
差距没这麽远吧
SGX543=9 F32 flops per pipe or 36 per core
SGX543MP4=36*4*200MHz=28.8gflops
大部份PS3游戏都是以720P或以上render
PSV在960*544之下应能有PS3的三成表现
USSE2什么时候有9 FP32 Flops per pipe了?
你要说它可以Vec4 + Scalar并发那没问题,但是Scalar是FP32,Vec4可是FX10 x4而不是FP32 x4的哦。
所以,在Vec4做FMADD的情况下,它也只是1 FP32 Flops+ 8 FX10 ops而已啊。9 FP32 Flops per pipe的那是XBOX360的C1……

[ 本帖最后由 hourousha 于 2011-11-23 13:54 编辑 ]



TOP

引用:
原帖由 u571 于 2011-11-23 14:10 发表
如果真倒退回FX10精度的话,真是一朝回到解放前了:D
但DX8也能作不少特效不是么?
而且PSV的shader使用关键是——混合精度,毕竟不是所有运算都需要浮点精度。所以能用FX10的地方用FX10,需要用FP16甚至FP32的地方用浮点不就得了。PS3用FP16精度的地方也很多嘛————除了NRMH单元只能用FP16外,其他情况下虽说FP32和FP16的理论throughput一样,用FP16比FP32更能缓解register的压力,所以用FP16还是有性能优势。


TOP

引用:
原帖由 JimmyC 于 2011-11-23 23:42 发表
经查证过後

每个USSE shader可处理
最低1 FP32 scalar, 最高2 FP32 FMADD, 或
2 FP16 (Vec2), 或
2 INT16 (Vec2), 或
4 ES2.0 Lowp (Vec3 or 4), 或
4 INT8 (Vec3 or 4)

由於数据通路宽度限制
USSE全速2 ...
如果是这样的话,那就说明我之前的信息有错了,不过这样一看,Imagination对USSE2的宣传语(多达两倍于USSE的浮点运算吞吐率峰值)似乎也太保守了点,这明明就是最差情况也超过两倍,而普通情况是4-5倍嘛。
不过这样一来,USSE2就从USSE的浮点标量结构(相近于G80)变成了传统矢量结构(接近于C1或R600)了,当然RawPower提升是很多,事情变得有趣了。对了你能不能得到那并行的1 float op是什么性质运算的信息呢?是SFU(复杂函数计算,诸如对数指数)还是别的什么?

TOP

引用:
原帖由 u571 于 2011-11-24 09:26 发表
PSV的分辨率也不算很低了,就算上双通道LPDDR2 1066等效带宽也就才8.3G/S,这点带宽还得跟CPU共享。
实际画面能比XBOX强的了多少真要打个大大的问号。
SGX的一些FrameBuffer操作移到了片内缓存上——所以它才能猛宣传16bit的Blending效果(因为中间结果以高精度存储于片内缓存,最终才转换为16bit输出至Framebuffer),又有很好的EarlyOut能力;而且总体而言,PSV的shader长度肯定要长于XBOX,这样一方面Pixel Throughput就下降了,再者有些shader trick是可以节省带宽的,因此对带宽的压力要比XBOX的情况小不少。
至于比XBOX强多少我认为不用担心,毕竟功能上是DX9级别 vs DX8级别,而且即使以这贴中的游戏截图来看,在比较受带宽影响的纹理精度方面总体看也还凑合。

TOP

发新话题
     
官方公众号及微博