» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] KZ2 DR技術概要文件公開 图片(杀猫)

引用:
原帖由 火彩 于 2007-8-12 10:16 发表


天师,你不装能死吗?
你来告诉我这个技术平庸人士,如何让PPE控制一个SPE将任务分配给同级的其他SPE?



我便是那个群下的受害者啊 :D
就是一个小P孩搞起来的东西,还不如蛋疼群讨论的东西好。
没办法,玩xo的都大叔

ps3人气可高了,小孩子们都知道“ps2的下一代”


TOP

引用:
原帖由 hourousha 于 2007-8-12 01:35 发表

如何通过DeferredShading来缓解诸如‘半透明粒子太多’这种消耗ROP和显存带宽的情形呢?
Deferred rendering没法用在translucent particle上吧。最多就是少画点,反正一般看不出来。



TOP

引用:
原帖由 ibelieveicandie 于 2007-8-12 10:28 发表
Deferred rendering没法用在translucent particle上吧。最多就是少画点,反正一般看不出来。
Deferred Shading是为了缓解overdraw导致的ROP不足的问题——比如大量半透明粒子情况,这不正是您前面说的吗?所以我才有异议的么。我说的就是对于需要alpha blending的半透明物体,通常还是需要使用传统方法绘制,DeferredShading帮不上什么忙啊。
只说overdraw的话,其实对于solid物体,传统渲染方式也可以通过不太复杂的办法避免大部分的overdraw啊。
换句话说,在大量半透明粒子的overdraw导致ROP不足之前,显存带宽会更早出现紧张啊。
所以,对于PS3来说,给他更多的ROP也没什么用。
所以,我还是认为Deferred shading的使用不是为了缓解ROP问题,而是纯粹的最直接的使用SPE辅助渲染的方式,尽管利弊都很明显。

[ 本帖最后由 hourousha 于 2007-8-12 10:54 编辑 ]


TOP

我觉得Deferred rendering主要是在PS3的结构上有两个好的地方, 一个是如H兄所说, 可以找到一个采用SPE的理由。在SPE的使用中, 就出现了IBL一项。

另外一个, 也是针对PS3的弱项的, 就是显存带宽。由于事实上PS3的RenderTarget可以mapping到任何一块逻辑内存(我记得没错的话甚至包括SPE的LS), 所以事实上使用MRT的结果是PS3的有效输出带宽近乎加倍了, 由22.4G增加到22.4 + flexIO 15G。所以采用高达36MB的render target之后, 仍然可以跑得动我认为这个理由必不可少。

但是FlexIO由于是需要占用XDR的带宽的, 所以这个改进不可能是免费的。使用这么大的render target的直接结果, 很可能就是整个PS3出现memory bandwidth bound的可能性比较大, 使CELL的实际性能下降。不过与其让整个瓶颈出现在DDR3这么小的一个部分, 这样也许是更好的结果。

至于ROP, 我觉得其实两边的主机都是8个ROP, 所以其实都不是很多。不过particle总是可以降低分辨率的, 所以我觉得应该总是会有一个取舍的空间。

TOP

引用:
原帖由 hourousha 于 2007-8-12 10:44 发表
Deferred Shading是为了缓解overdraw导致的ROP不足的问题——比如大量半透明粒子情况,这不正是您前面说的吗?所以我才有异议的么。
Deferred shading可以缓解ROP不足问题,而不是缓解“大量半透明粒子导致的overdraw及ROP不足问题”,请勿曲解我的原意。Deferred shading对于粒子渲染并无太多好处。
引用:
所以,我还是认为Deferred shading的使用不是为了缓解ROP问题,而是纯粹的最直接的使用SPE辅助渲染的方式,尽管利弊都很明显。
我同样不认为KZ2用到SPE来实现deferred shading。MRT同样是通过RSX实现的。SPE能做到的是prepare draw list之类的操作。当然image-based lighting用SPE来实现应该是有效的,但是这个操作用SPE来做也未必比GPU快。

[ 本帖最后由 ibelieveicandie 于 2007-8-12 14:59 编辑 ]

TOP

引用:
原帖由 RacingPHT 于 2007-8-12 14:16 发表
我觉得Deferred rendering主要是在PS3的结构上有两个好的地方, 一个是如H兄所说, 可以找到一个采用SPE的理由。在SPE的使用中, 就出现了IBL一项。

另外一个, 也是针对PS3的弱项的, 就是显存带宽。由于事实上P ...
带宽是本质因素。

不过,假如想用SPE来辅助渲染,就必须把intermediate render target放在内存里。PS3本来内存就不足,这样一来。。。看来确实只能把audio和animation往显存里塞了。

总之SPE辅助渲染有不务正业的感觉。如果真的free也就算了,但现实中不是没有代价的。

[ 本帖最后由 ibelieveicandie 于 2007-8-12 15:03 编辑 ]

TOP

"audio和animation往显存 塞".....究竟是哪個遊戲將PS3 的內存操到這麼寒傪

TOP

引用:
原帖由 ibelieveicandie 于 2007-8-12 14:54 发表


带宽是本质因素。

不过,假如想用SPE来辅助渲染,就必须把intermediate render target放在内存里。PS3本来内存就不足,这样一来。。。看来确实只能把audio和animation往显存里塞了。

总之SPE辅助渲染 ...
主存过少确实是PS3最大的问题.. PS3的结构本来应该是512 + 256, 实在不行512 + 128我觉得比现在好得多。反正flexIO本来就设计得很强。
既然近乎75%的SPE都没事做...我觉得尽可能分一些post-process或者project shadow filtering过去也是好的。反正RSX大概是空不下来了。

而且我觉得和XBOX版的Shrek相比, 这次render target能用掉4个也是在是不能算packed tightly。难道带宽真的已经很充裕了?

TOP

顯存256跟顯存128 相比對於遊戲設計上的技巧實作與效能影響不大嗎?

TOP

因为内存做显存用,比显存做内存用容易。
所以,宁可显存不够用的机会多一点,也别内存不够用的机会多。

TOP

引用:
原帖由 RacingPHT 于 2007-8-12 14:16 发表
我觉得Deferred rendering主要是在PS3的结构上有两个好的地方, 一个是如H兄所说, 可以找到一个采用SPE的理由。在SPE的使用中, 就出现了IBL一项。

另外一个, 也是针对PS3的弱项的, 就是显存带宽。由于事实上P ...
对FlexIO原理不是很了解,能否详细说说?特别是为何会占用XDR带宽?难道FlexIO不是独立辟出的通道么?

TOP

引用:
原帖由 上海恐龙 于 2007-8-12 15:54 发表


对FlexIO原理不是很了解,能否详细说说?特别是为何会占用XDR带宽?难道FlexIO不是独立辟出的通道么?
实际上访问内存做显存占据的是XDR带宽,但是因为XDR带宽大于FlexIO(在PS3这个案例下),所以实际提供的额外显存带宽由FlexIO决定。

TOP

引用:
原帖由 村上春樹 于 2007-8-12 15:50 发表
顯存256跟顯存128 相比對於遊戲設計上的技巧實作與效能影響不大嗎?
我觉得是这样的。前提是事实上XDR和flexIO确实很快(20GB/s download)。所以texture可以放在主存中。

总比现在audio放在显存里的做法要正常。

TOP

引用:
原帖由 卖哥 于 2007-8-12 15:55 发表

实际上访问内存做显存占据的是XDR带宽,但是因为XDR带宽大于FlexIO(在PS3这个案例下),所以实际提供的额外显存带宽由FlexIO决定。
囧,原来如此

也就是说在本身主存就不足的情况下,XDR的表现也会遇到瓶颈咯?

TOP

引用:
原帖由 村上春樹 于 2007-8-12 15:50 发表
顯存256跟顯存128 相比對於遊戲設計上的技巧實作與效能影響不大嗎?
假设游戏需要用到192M显存,其中64M因为某些原因不得不放在内存里(比如deferred shading的一些temporary render target),那么显存有128M也够了。

其实,对于PS3而言,既然已经给RSX设计了FlexIO,那么最好的内存组织方案是512+0,unified memory架构。这样对于充分发挥SPE的能力是绝对必要的。之所以用现在的256+256可能还是成本因素吧。

TOP

发新话题
     
官方公众号及微博