» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[转帖]我們終於學到了PS3做Real Time Radiosity實在是屌到不行!(非作者原标题)

引用:
原帖由 zhangjingy 于 2007-8-16 10:53 发表


看你的表现了,我好提拔你。
难道是传说中的抓着自己头发把自己提起来的火星技术?

天师果然是天师啊~


TOP

引用:
原帖由 ibelieveicandie 于 2007-8-16 10:56 发表


难道是传说中的抓着自己头发把自己提起来的火星技术?

天师果然是天师啊~
如果你认为你是天师,那就这么理解吧。



TOP

引用:
原帖由 Eji 于 2007-8-16 05:15 发表


別急著這麼說,有時候這真的和擅長的方向有關。
科學運算的領域都是如此了,何況沒有什麼研究開發資源的遊戲市場。

這邊舉個例子:
Programming the Cell Processor

DDJ寫程式的應該很多人知道.... ...
Eji,你po 這篇文不來支持你的結論「遊戲開發者不盡心力」不很適當。20行的C代碼投入人力程式碼變成1200行,60倍的增長。C Code V.S 組語
第一,遊戲程式的專案執行必須在合理的成本與人力下遂行。
第二,C Code 與ASM 沒有可比性。

[ 本帖最后由 村上春樹 于 2007-8-16 12:21 编辑 ]


TOP

引用:
原帖由 zhangjingy 于 2007-8-16 10:26 发表


Shader性能要求较高,需要权衡。XO其实也能用NAO32,不过损失过多的Shader性能,有些得不偿失。总得说NAO32比较适合RSX这种Shader性较强的显卡。
nAO 自承未碰過xo,哪來啥XO 也能用nAo 32 但會帶來過多shader性能損失?

自己yy RSX 的高,再YY C1 的低吧。

TOP

downsample,就是把MSAA的subsample加权平均成最终pixel颜色的过程,以前的PC GPU都是所有subsample等权。
PS3的Heavenly Sword,因为使用的是Luv32 color space,所以需要使用custom AA filter先decode subsample to RGB color space然后再average subsample in RGB color space,的代价就是subsample外加平均运算,每个pixel处理大概耗费每条pixel shader流水线20个时钟周期。

C1支持不支持R600引入的非等权downsample呢?

TOP

引用:
原帖由 村上春樹 于 2007-8-16 12:15 发表


nAO 自承未碰過xo,哪來啥XO 也能用nAo 32 但會帶來過多shader性能損失?

自己yy RSX 的高,再YY C1 的低吧。
Shader损失多少是相同的,不过对C1来说,Shader性能本身就不如RSX,所以得不偿失。

TOP

看来madden ps3版用到nao32了:D

TOP

引用:
原帖由 爱你一棒陲 于 2007-8-16 12:18 发表
downsample,就是把MSAA的subsample加权平均成最终pixel颜色的过程,以前的PC GPU都是所有subsample等权。
PS3的Heavenly Sword,因为使用的是Luv32 color space,所以需要使用custom AA filter先decode subsa ...
上面那段话怎么那么像我在chiphell说的呢:D
C1可以把subsample给resolve出来,后面的downsample就是很自由的了,当然,这样的代价就是shader资源。因为这放弃使用ROP,而是用shader来做downsample。
而4xMSAA实在没有必要用非等权的filter kernel。
HS那是由于使用和RGB非线性相关的颜色空间,所以不能用ROP的downsample功能,必须使用custum downsample。

TOP

引用:
原帖由 RacingPHT 于 2007-8-16 10:25 发表
小程式与大程式的区别是巨大的 。Eji兄毕竟不是程序员, 有些话其实你不是很适合说。
DDJ这篇文章我们这边第一时间就已经看过了, 其中一个明显的疏漏, 就是拿手工优化的SPE ASM与最原始的C代码和P4比性能。 ...
其實就我所知,大部分的狀況CELL的性能都是拿optimize過的asm code和x86 C code比性能。
這不是在講"這樣比正確不正確",而是在講"這其實是最常見的狀況"....即使這個情況有問題。

這邊有另一個反例:
當初Pentium4/Core2Duo的SACD decode,optimize到最後還是可以在2GHz上的Core2 Dou上順利執行,也被Intel Compiler當成成功案例宣傳。
廣告:http://jp.xlsoft.com/documents/intel/case/sdna_case_study.pdf
後面VAIO系列的DSD direct player就是透過這點達成的,前後性能差了3.5倍.... 而這還是靠compiler和optimize達成的,意義更大。

而PS3的SACD CODEC主要的目的是為了累積CELL上操作的know how,所以它企圖做到的optimize degree會比較高。
另外一個問題是,一個較少自動功能的CPU本身的可optimize程度也會比較高。(OOO之類的CPU行為是很難人力預測的)

-----
然後前文每篇都有提到遊戲廠商有合理成本的要求與壓力,後面跟幾篇內容無關的回文,就變成小弟的原文有問題了,這不是很奇怪....

[ 本帖最后由 Eji 于 2007-8-16 13:04 编辑 ]

TOP

引用:
原帖由 村上春樹 于 2007-8-16 12:13 发表
Eji,你po 這篇文不來支持你的結論「遊戲開發者不盡心力」不很適當。20行的C代碼投入人力程式碼變成1200行,60倍的增長。C Code V.S 組語
第一,遊戲程式的專案執行必須在合理的成本與人力下遂行。
第二,C Code 與ASM 沒有可比性。
我覺得與其說我這幾篇文的結論是「遊戲開發者不盡心力」,倒不如說是「遊戲開發者非戰之罪」比較適當。
倒比較像是你把我的文章曲解成"我想表達你文中指出的意思"?

1. 兩次發文都提及"遊戲廠商無法接受的成本"
2. 兩次都提及程式碼的增長
不過這當然意義也不大,因為這困難度也不是線性成長的。

----
話說我比較想知道的是,當廠商解決這些問題之後,這些討論回頭看到底會得到怎樣的評價。
大概會和許多年前就已經開始講的multi-core到來一樣吧,或遲或早的問題。

本來這些事情就和PS3的成敗無關了.... 是比較和CELL本身有關。

[ 本帖最后由 Eji 于 2007-8-16 13:47 编辑 ]

TOP

程式优化成本还是由sony承担吧,然后扔个函数库出来给你们游戏厂商随便用:D

TOP

引用:
原帖由 carnon 于 2007-8-16 13:18 发表
程式优化成本还是由sony承担吧,然后扔个函数库出来给你们游戏厂商随便用:D
悄悄地问一下:难道SONY在SF的心里其技术能力如此强大?

TOP

引用:
原帖由 carnon 于 2007-8-16 13:18 发表
程式优化成本还是由sony承担吧,然后扔个函数库出来给你们游戏厂商随便用:D
SONY搞不定這種事情吧。XD
連 RapidMind 之類的廠商也只能處理掉很限定的工作....

TOP

引用:
原帖由 zhangjingy 于 2007-8-16 12:27 发表


Shader损失多少是相同的,不过对C1来说,Shader性能本身就不如RSX,所以得不偿失。
C1 SHader 性能不如RSX ,數據在哪?怎麼算?就算不如,「得不償失」概念怎來的?

[ 本帖最后由 村上春樹 于 2007-8-16 13:54 编辑 ]

TOP

引用:
原帖由 Eji 于 2007-8-16 13:44 发表

話說我比較想知道的是,當廠商解決這些問題之後,這些討論回頭看到底會得到怎樣的評價。
大概會和許多年前就已經開始講的multi-core到來一樣吧,或遲或早的問題。

本來這些事情就和PS3的成敗無關了.... 是比較和CELL本身有關。
完全同意。实际上PS3的成败并不取决于技术,仍然是成本与商业推广。

这里的讨论只是基于具体架构的发展潜力,PS3的硬件也不是这一架构的最佳执行者。另外,当这种架构历经发展体现出自身的优势之时,恐怕x360/PS3这一代游戏机也快入土了。

TOP

发新话题
     
官方公众号及微博