» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[转帖]我們終於學到了PS3做Real Time Radiosity實在是屌到不行!(非作者原标题)

引用:
原帖由 Eji 于 2007-8-15 18:12 发表


SpeedTree有個SPE的版本,KZ2也宣稱用SPE作particle,不過KZ2的particle目前看來精確度不算高,可能和頻寬有關?
照理說KZ2那份pdf的SPE runtime應該就是執行時間,但是不知道SPE的總執行時間多少,所以很 ...
PS3游戏都不能指望在particle system上有好的表现。一个拟真的particle system需要大量overdraw,导致的硬件固有的ROP处理能力不足和带宽问题会体现的尤其明显,只怕任何火星技术都不能够解决这个问题。

实际上X360和PS3的ROP相差不算大,但edram和vddr3的带宽就相去甚远了。


TOP

老E把我的问题忽视了。

LAIR对于CELL的图形辅助做出了什么成绩吗?



TOP

引用:
原帖由 爱你一棒陲 于 2007-8-10 16:18 发表
nAO32啊?似乎改名MDR比较合适,HDR的H体现在何处呢?32位RGB可不算哦。
? C1不是FP10嗎?記得eDRAM內的Alpha blending都是用FP10啊。


TOP

天师满塞……

TOP

引用:
原帖由 zhangjingy 于 2007-8-15 18:43 发表
老E把我的问题忽视了。
LAIR对于CELL的图形辅助做出了什么成绩吗?
有啊,只是不太想講:Lair使用的剛好是先前JC大神批評的方法之一。

JC大神表示,他認為他的MegaTexture技術使用上比較有效率,實作上也比較簡單容易,不需要用強力的CPU作很複雜的LOD系統。

Lair則是選擇用CPU作LOD的典型,Lair實作的是Progresive mesh,可以隨著遠近距離動態改變場景的複雜度。
這已經不是新技術了,也有人在GPU上實作過。

[ 本帖最后由 Eji 于 2007-8-15 19:59 编辑 ]

TOP

难道LAIR图形方面做得不好吗?看来很多技术高深的人都没有掌握好CELL使用的最佳方向,主要是能做的事情太多了。

[ 本帖最后由 zhangjingy 于 2007-8-15 20:16 编辑 ]

TOP

也请各位大大帮忙分析下我这lu的问题~

kz2真能有实时光能传递的效果吗?

要真的有,贴图糊点也算了~

不过确实太糊了~hl2的质感都比之好,看了geow和bioshock~

再看看kz2的质感~天,简直谈不上质感~
确实让人很不适应

难听点说..也就dc级别的贴图水准~

难道rsx ps单元资源用光了?都用到哪里去了?

泛用normalmap已经是次世代的入门标准了,可kz2呢?
让人更想不通的是各大媒体居然对kz2的画面给予较高的评价~
视频看了一次又一次,除了觉得面数超多外(嗯mgs4的snake的面数也够多的)
至于kz2的其他也就十分地一般~


rsx对比c1真的差那么多么?毕竟是年份相近的技术~

假如c1+cell,会不会出现飞跃的效果呢?


扯远点~同是ue3,俺觉得geow角色比bioshock饱满多了,bioshock的角色给人感觉
面数稀薄~
但场景质感,尤其是对水的描绘,实在前无来者~这是分配ps和vs资源所产生出来的矛盾么?

[ 本帖最后由 倍舒爽 于 2007-8-16 01:58 编辑 ]

TOP

引用:
原帖由 zhangjingy 于 2007-8-15 20:06 发表
难道LAIR图形方面做得不好吗?看来很多技术高深的人都没有掌握好CELL使用的最佳方向,主要是能做的事情太多了。
別急著這麼說,有時候這真的和擅長的方向有關。
科學運算的領域都是如此了,何況沒有什麼研究開發資源的遊戲市場。

這邊舉個例子:
Programming the Cell Processor

DDJ寫程式的應該很多人知道....他們刊載過一篇CELL在HPC optimize的相關文章。
有個很傷眼睛的例子在page3:

一個只有60行程式碼的小程式,BFS(breadth-first search,寬度優先搜尋),學校作業等級的東西。
不屬於這個領域但想知道BFS是什麼的可以參閱Wikipedia維基百科

DDJ在第三頁也列出了他們使用的程式碼。
在一台Pentium4 HT 3.4GHz上跑的性能是每秒鐘搜尋2千4百萬個邊(24million/s),
重寫過後的程式,CELL上面的性能則是每秒搜尋5億3千8百萬個邊(538million/s)。

也就是說在CELL上面透過有效的最佳化,得到了一顆Woodcrest約22倍以上的效能,一顆SPE就有1.5(35million)~4.75倍(114million)不等的實力,總性能足以和256顆CPU版的BlueGene/L單挑;不過在此同時,他們最佳化的程式碼也長了20倍,達到1200行。_A_
(該文後面有詳解,想了解如何在CELL上寫好程式請不要錯過)

好,這是鼎鼎大名的DDJ,三位作者都是任職於PNNL的專家,而他們在標題上就寫值得努力。
那遊戲界有多少人有這個能耐?有多少人想花這個時間?花的時間和金錢是不是和效能成正比?
我們看看他們現在的態度就知道了。

[ 本帖最后由 Eji 于 2007-8-16 06:23 编辑 ]

TOP

引用:
原帖由 Eji 于 2007-8-16 05:15 发表

別急著這麼說,有時候這真的和擅長的方向有關。
科學運算的領域都是如此了,何況沒有什麼研究開發資源的遊戲市場。

這邊舉個例子:
Programming the Cell Processor

DDJ寫程式的應該很多人知道....他們刊載過一篇CELL在HPC optimize的相關文章。
有個很傷眼睛的例子在page3:

一個只有60行程式碼的小程式,BFS(breadth-first search,寬度優先搜尋),學校作業等級的東西。
不屬於這個領域但想知道BFS是什麼的可以參閱Wikipedia維基百科。

DDJ在第三頁也列出了他們使用的程式碼。
在一台Pentium4 HT 3.4GHz上跑的性能是每秒鐘搜尋2千4百萬個邊,
重寫過後的程式,CELL上面的性能則是每秒搜尋5億3千8百萬個邊。

也就是說在CELL上面透過有效的最佳化,得到了一顆Woodcrest約22倍以上的效能,足以和256顆CPU版的BlueGene/L單挑;
不過在此同時,他們最佳化的程式碼也長了20倍,達到1200行。_A_
(該文後面有詳解,想了解如何在CELL上寫好程式請不要錯過)

好,這是鼎鼎大名的DDJ,三位作者都是任職於PNNL的專家,而他們在標題上就寫值得努力。
那遊戲界有多少人有這個能耐?有多少人想花這個時間?
我們看看他們現在的態度就知道了。
看来Cell的性能果然是P4的22倍呀!!!!

天师看好了,再发一贴

Cell你究竟有多强悍!!!秒杀!!!

TOP

引用:
原帖由 eastspider 于 2007-8-16 06:12 发表
看来Cell的性能果然是P4的22倍呀!!!!

天师看好了,再发一贴

Cell你究竟有多强悍!!!秒杀!!!
不要光看數字啦.... 單一SPE可以跑到最高接近5倍,也就是說這其實也是個4個SPE之後性能就不會明顯提升的狀況。

此外,BFS是個AI領域會用到的基礎演算法,有改良過的技術。
這個演算法本來根本沒幾行,但是原文提到的最佳化技術一狗票,
loop unrolling, function inlining, SIMDization比較常用, bulk synchronous parallelization, DMA traffic scheduling, overlapping of computation and transfers就比較少見了。
(第一步就搞迴圈展開,這也是在講SPE真的不適合做分支)

總之,這的確是會讓人擔心實際遊戲用到的演算法,真的要最佳化不是沒辦法,性能也可以預期....(而且是專家預期的)
但是只怕複雜度超出大部分遊戲廠商的能耐,要花的時間(成本)對廠商來說大概是天文數字。

所以一般狀況下,廠商不是不能而是不為的機會最大。
當年有人在EE的VU上做過類神經網路模擬,所以很多技術的事情沒深入了解真的別亂說。

[ 本帖最后由 Eji 于 2007-8-16 08:30 编辑 ]

TOP

引用:
原帖由 Eji 于 2007-8-16 05:15 发表


別急著這麼說,有時候這真的和擅長的方向有關。
科學運算的領域都是如此了,何況沒有什麼研究開發資源的遊戲市場。

這邊舉個例子:
Programming the Cell Processor

DDJ寫程式的應該很多人知道.... ...
看来又毫不留情面地抽了UBI的开发者。EA的借口是时间,UBI是什么呢?技术底下?让他们看看DDJ的文章可能会感悟吧。

TOP

做游戏是要讲成本的,优化ps3的边际成本实在太高,不能怪ea,ubi啊

TOP

引用:
原帖由 zhangjingy 于 2007-8-16 08:36 发表


看来又毫不留情面地抽了UBI的开发者。EA的借口是时间,UBI是什么呢?技术底下?让他们看看DDJ的文章可能会感悟吧。
天师终于找到一个永远不败的理由了, 就算等到10年后,天师都可以继续恬着脸说,不是ps3不强大,而是因为那些开发者脑残不懂的如何利用而已。   恭喜恭喜

TOP

引用:
原帖由 Eji 于 2007-8-15 19:13 发表


? C1不是FP10嗎?記得eDRAM內的Alpha blending都是用FP10啊。
是7E3 FP10浮点像素精度没错。总比INT8和nAO32色彩正确,比上不足比下有余。

TOP

引用:
原帖由 zhangjingy 于 2007-8-16 08:36 发表


看来又毫不留情面地抽了UBI的开发者。EA的借口是时间,UBI是什么呢?技术底下?让他们看看DDJ的文章可能会感悟吧。
天师,你们部门还招人吗?帮我介绍个工作吧?

TOP

发新话题
     
官方公众号及微博