» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

重点贴:TGS部分PS3游戏桢数不足的原因,西川善司的分析~ RSX相关资料,游戏评论追加

引用:
原帖由 bfking 于 2006-9-26 22:42 发表
这些文章有些看点~~~呵呵,这个我赞同,1080p的话,aa的作用很重要了吗?
aa作用问题,那得看各人眼睛的需求了……
比如觉得720p下AA无所谓,那么1080p下AA与否显然就更加无所谓了。
但如果觉得720p下4xAA才能接受,那么1080p下显然2xAA都会觉得不爽。
这里有一个MSAA相关的名次——EER:即边缘等效分辨率,即在某倍AA下,几何体边缘的平滑度近似相当于多少倍分辨率的效果。
对于XO来说,2xAA的EER是2x2,也就是说边缘的效果接近于2560x1440,4xAA的EER是4x4,也就是边缘效果接近于5120x2880。
同样,RSX的2xAA也是2x2 EER,4xAA是4x4EER,当然,根据G70来推测,RSX也许还有更多的AA方式,不过,720p@4AA的边缘效果基本来说要稍好于1080p@2xAA or 2xQ


TOP

还有,原文中说道
引用:
1080P 的運作並無太大問題, Shader power
是絕對足夠的,
我不晓得在计算机诞生以来还有‘绝对足够’这么一回事……
然后,后面又有句话(好像是译者自己的观点)
引用:
問題是 360 的 Shader Power
夠嗎?
单独看起来没有什么问题,但和上面的联系起来,就比较搞笑了……



TOP

引用:
原帖由 我不认字儿 于 2006-9-27 09:53 发表


我只需要看实际效果…………
卖西瓜的都说自己的瓜甜,甜不甜不是你卖瓜决定的,而是由西瓜的真正品质决定的。那就是实际品尝。本身就是生瓜蛋子你说你的瓜甜谁能信?

YY是可以的,那是建立在双方都没有实 ...
嗯……您是在针对我的回帖发言嘛?


TOP

引用:
原帖由 Pele 于 2006-9-27 10:01 发表
绝对足够,应该是说shader是rsx这个木桶上最长的一块木板。
只要是做游戏而不是作tech demo,不会发生水从它那里漏出去的情况
第一句同意。相对而言RSX的shader power算是比较令人满意的了。
第二句不同意,既然绝对足够,那么就不应该给开发者限制,但事实是,如果想耗尽shader power(在其他成为瓶颈前)也完全不是难事。

TOP

XO做native 1080p的最主要问题是EDRAM容量太小(1080p需要的color+z buffer容量是1920x1080x4Byte*2接近16M),这代表必须tiling,属于有些麻烦。这就是在性能损耗外的开发上的不利,另一方面就是XO和PS3都会面对的性能上的捉襟见肘。
让我们来看PC的情况,无论用多高端的电脑,哪怕是quad-SLI,只要不是很老的游戏,分辨率从1024提升到1600或更高都会导致fps下降,说明,目前的GPU远没到pixel相关性能大大富裕的程度。
1080p相对于720p,像素数量提升到了2.25倍,所以‘1080p会降特效’说法就算有些不全面。但如果换成‘全力发挥的1080p相对于全力发挥的720p,在渲染复杂度上有所欠缺’是绝对不会有错的。
所以,我觉得1080p尽管有部分优势,但我更倾向于720p+AA。
至于PS3的720p和XO的720p相比,得看什么渲染方法,比如用延迟渲染技术,PS3胜过XO的概率极其低……

TOP

引用:
原帖由 zhangjingy 于 2006-9-27 10:52 发表
从多款XO已经发售的游戏中辛苦地挑选出不错的实拍图片,和PS3上没发售的,只能是网上有什么放什么的图片相比较本身就是不公平的,况且顶多和PS3打个平手,XO够丢人的了。PS3现在能拿出的只是试玩中的场景内容,离 ...
05E3上的‘PS3游戏画面’我相信可以把若干年后的XO游戏画面打得满地找牙
所以就算如您所说‘目前XO和PS3打个平手’我也没觉得XO有什么可丢人的~

[ 本帖最后由 hourousha 于 2006-9-27 11:01 编辑 ]

TOP

deferred rendering的本质作用是把几何复杂度造成的渲染冗余降到最低。
它的步骤是分两步,第一步是把scene渲染成G-Buffers,也就是把场景的属性输出到多个纹理中,这部分的特点是可能有很多的冗余计算(比如计算了看不到的、被遮挡的三角形顶点),而PS部分相对简单(一部分是不少三角形和像素已经被预先cull掉了,另一部分在这步中PS不需要进行材质shader运算)这也是DR的目的。
第二步是将G-Buffers的信息作为输入,计算出最终场景效果,这部分是完全的像素操作。所有经过计算的像素都是可见的(无任何无效渲染),这里面根据G-Buffer安排不同可能会用到dynamic branch(比如把某一个G-Buffer的一个通道作为Material index buffer)。
而对于C1来说,无疑是非常胜任这种渲染方式的,第一个过程中,vs:ps比例可以调整为1:2或者2:1,而第二个过程则是完全的0:3。而且C1的dynamic branch性能是毋容置疑的,所以……
当然PS3也有优势方面咯,至少它的Mem的速度和延迟方面还是不错的——除去作为frame-z buffer的用途无法和XO相比外。Cell也比较有趣。

不过总之,基本上要想找到PS3的技术上利好消息,还是去找Eji或者cho这些N饭比较合适。像我这种既不喜欢Nv又不喜欢SCE的,基本不会带来让您很欣喜的消息。

[ 本帖最后由 hourousha 于 2006-9-27 11:24 编辑 ]

TOP

还是可以稍微期待一下Cell在DR中的作用。不过一个SPE尽管频率达到RSX的6倍多,但可不代表一个SPE能顶6个PSU哦。

TOP

引用:
原帖由 zhangjingy 于 2006-9-27 11:33 发表


“顶多打个平手”,我们也很满意,又回到了DC和PS2初期,画面差距不大的情况上了。
知足美……

TOP

引用:
原帖由 备常炭 于 2006-9-27 12:28 发表
メモリバス幅                     256bit                     128bit
フィルレート                     68億8,000万テクセル毎秒       40億テクセル毎秒


这两个阉得太厉害了,恰恰是提高分辨率的致命伤
这俩其实是一回事,前一个是关键点,换句话说,即使扔给它64个rops,理论上pixel fillrate升到32G,第一个不变也还是浪费掉,就目前这个配置,多数情况下,在rop/pixel/zixel fillrate成为瓶颈前,local mem bandwidth已经成为瓶颈了。

TOP

引用:
原帖由 软变硬 于 2006-9-27 12:40 发表



   为什么不用256bit  600MHZ的GDDR3呢?现在都是白菜价了,  如果用这个的话,成本不会提升太多的啊,而且功耗还降低了。SONY的硬件工程人员都是吃屎长大的吗?
我不是搞硬件设计的,这个也许和当初SCE和Nv的协商有关。
至于SCE的工程人员是不是吃屎……Maybe……呵呵。

其实位宽和‘不会造成严重浪费rop数量’有一种简单的换算关系。
第一步,计算出核心频率和显存频率的比,比如RSX是650/500 = 1.3
第二步,上一步结果*位宽*2(如果显存是DDR1-3)/32,对于RSX来说,这等于8*1.3 = 10.4
所以可以看出RSX最多配个10个rop就到头了。
解释一下第二步最后的32是如何来的。
这是根据一次Rop操作涉及的数据读取量而定的。
拿最简单的典型ROP操作——把register中的片段数据写入framebuffer的过程来说。
它一般需要一次读——读zbuffer中的深度信息——这一般是一个32bit读取
比较该深度和片断深度——这不涉及显存读取
比较stencil/alphatest,这也不涉及显存读取
如果检测失败则抛弃该片断——完毕,这种情况总操作是一个32bit读取
否则,接下来是两次写——将片断颜色(一般为32bit)和片断深度(32bit)写入color buffer和z-buffer中。这种情况是一个32bit读取+64bit写入。
当然,如果不使用stencil,将z精度降低,也可以做成16bit读取or 16bit读取+48bit 写入。
这样下来就有了——平均起来,一次Rop操作涉及的数据位数不会低于32bit。
其他情况举例
1:不使用z-buffer,只写,这样一次rop操作多数情况是32bit数据写入
如果使用alphatest,不通过的情况不用写入,就是0 bit
2:使用alpha blending不使用z-buffer
一次32bit读取(读取color buffer中颜色)+一次32bit写入(运算后写入color buffer),如果同时运用alpha test,则有些情况不用写
3:使用alpha blending外加z-buffer
一次32bit+32bit读取(color+z)一次32bit+32bit写入(color+z),有些情况不用写入(z/stencil/alphatest失败)
所以alpha blending是带宽大敌
4:4xMSAA
4次z读取,4次z比较,0-4次z写入,0-1次color写入
这个代表什么,不用多说了……
5:4xMSAA+Alpha Blending
自己算咯……

从上面可以得出,平均一次rop操作按32bit需求来算已经是非常节约的算法了。所以像R300等,是基本按照一次rop对应64bit来计算的,而新的GPU,也在不断改进显存控制(比如R580的ring-bus)前提下,不增加rop数量,不是厂商小气,而是实在用不着。
即使现在的PC GPU情况,alpha blending,MSAA依然造成显存瓶颈(见GDC06的相关paper)

从分辨率角度讲,分辨率提升,每一个几何体对应的片断数就越多,所以自然rop操作就越多,所以就需要更高的带宽/更多的rop power,当然这个带宽可以用提高频率/rop数量/显存位宽等不同途径达到。

[ 本帖最后由 hourousha 于 2006-9-27 13:31 编辑 ]

TOP

引用:
原帖由 软变硬 于 2006-9-27 13:49 发表


你觉得RSX配置多大的显存位宽和ROP是最合理的?

另外这个听说RSX频率缩水了。NV还真是RP比较差的厂商,当年在XB上搞这样一次,PS3上又来一次。
我觉得保持住256bit就成了,也没必要像C1做的那样绝——代价是EDRAM的容量。
频率也没缩多少,分别缩了50Mhz。反正原来也没人指望这50Mhz有多大用处。

NV一直是推行多赚原则,对于厂家来说这也无可厚非。

TOP

散热问题也是很可能的。

也许SCE不想让RSX过于强大才做此决定也没准……呵呵

TOP

发新话题
     
官方公众号及微博