» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] KZ2 DR技術概要文件公開 图片(杀猫)

引用:
原帖由 aeondxf 于 2007-8-12 00:53 发表

如果larrabee真的是32个IN-ORDER的X86,那么这就是larrabee对CELL的优势。CELL不错,在自己的领域,如果用在PS3上那么PPE太废了,而SPE太多了。
但Cell能当主CPU,larrabee么还不确定,目前看来似乎不行,英特尔也没这个打算。

其实解决不同类型处理器负载平衡的方法也是有的,那就是通过API来调用,AMD和英特尔都打算靠API实现。
而,ATI和Nv设计的流处理器,需要为它们专门写软件,这个就前途有限了。

而且还有更好的方法,就是通过虚拟机,而打算靠并行虚拟机实现动态平衡的处理器设计正是龙3呀!虽然是不是放高炮不得而知。


TOP

引用:
原帖由 卖哥 于 2007-8-12 00:45 发表
Cell的问题在于它是非对称的,给PPE跑得东西不会因为PPE忙、SPE空闲就能分配过去,反过来也一样。
谁让你只用ppe?只用ppe的话cell跟其他奔腾3单核cpu还有啥区别?每个spe都是可以单独编程调配的,由ppe来分配job给每个spe的后果是出现ppe瓶颈



TOP

引用:
原帖由 carnon 于 2007-8-12 01:07 发表



谁让你只用ppe?只用ppe的话cell跟其他奔腾3单核cpu还有啥区别?每个spe都是可以单独编程调配的,由ppe来分配job给每个spe的后果是出现ppe瓶颈
说真的,我非常佩服这种programmer~可惜IBM努力的方向貌似是PPE更加精简从而达到I/O controller的水平。


TOP

I/O 控制关cpu内部啥事

ibm的初级cell教程就是教如何调用spe的,有关ppe瓶颈问题貌似也可以上ibm网站上看

[ 本帖最后由 carnon 于 2007-8-12 01:21 编辑 ]

TOP

引用:
原帖由 xekrn 于 2007-8-11 23:01 发表
先讲了deferred shading原理
然后把G BUFFER里存的5张图贴出来
然后介绍怎么压缩数值又保证精度地把各个数值(depth normal spec etc)存在G BUFFER里,奇怪的是G BUFFER不支持浮点纹理么?还是带宽实在不够只 ...
G Buffer和PS3 SDK没什么关系.

TOP

不错不错

TOP

roadrunner=Opteron+CELL——这就对了!
PS3=ppe+spe——咳咳……

TOP

引用:
原帖由 ibelieveicandie 于 2007-8-11 20:45 发表
假如场景复杂,或者半透明粒子过大过多,overdraw严重的话,ROP性能不足就是致命的。
ROP性能不足对于实现FP16 HDR或者MSAA影响也很大。
但是deferred rendering可以避免大多数overdraw,从而减轻对R ...
pdf没来得及看,几点看法。
1:所谓deferred shading,大概还是主要应用于solid物体上吧,alpha blending始终是deferred shading的弱项,换句话说,一般情形还应该是solid rendering使用Deferred Shading避免overdraw同时得到极其优秀的batch特性。而在deferred shading之后,再使用通常方法渲染transparent物体。所以如何通过DeferredShading来缓解诸如‘半透明粒子太多’这种消耗ROP和显存带宽的情形呢?
2:其实我觉得吧,大概只是由于DeferredShading是一种可以简便而高效利用SPE的办法,所以才采用的,毕竟SPE做deferred shading这种image-space processing是很快很合适的。
3:我觉得吧,PS3上deferred shading的弱点在于本来system mem就不怎么富裕,G-buffers一搞,那就更剩不了多少了:D

4:之于是否适应于XO和新一代PC,说到底,需求不像PS3那么迫切,新一代GPU和C1这种同时拥有UnifiedShader和不错的dynamic branch性能的东东,基本上对各种情况都适应很好,所以使用DS与否完全看实际需要,而对于PS3这种至少目前总是不得已对外宣称‘只发挥了20%、30%’的情况,大概才很有必要用DeferredShadingS来榨榨了,尽管很多情况,DS的负面作用不见得小。

TOP

引用:
原帖由 carnon 于 2007-8-12 01:19 发表
I/O 控制关cpu内部啥事

ibm的初级cell教程就是教如何调用spe的,有关ppe瓶颈问题貌似也可以上ibm网站上看
OH~YEAH~
好久没看到H大上lu了,虽然lu现在的娱乐性没有以前那么好……

TOP

引用:
原帖由 helllee 于 2007-8-11 18:49 发表
好东西 正在下 pdf
感觉这说明文档 比 Source的说明文档容易懂
关于Source的文档,不知道radiosity map基本生成原理的人基本看了白看,因为radiosity normal map技术属于对原有技术的比较明显的创新。
至于这个文档,由于DeferredShading从第一个demo(PowerVR做的那个)到现在都有4年了吧,所以……

[ 本帖最后由 hourousha 于 2007-8-12 01:59 编辑 ]

TOP

引用:
原帖由 aeondxf 于 2007-8-12 01:39 发表
OH~YEAH~
好久没看到H大上lu了,虽然lu现在的娱乐性没有以前那么好……
几个月前有段时间上LU很慢,所以就一直没怎么去,不过好像改版了之后速度挺快的:D

TOP

引用:
原帖由 hourousha 于 2007-8-12 01:59 发表

几个月前有段时间上LU很慢,所以就一直没怎么去,不过好像改版了之后速度挺快的:D
话说lu的sf开了一个群,貌似像联盟军那样一方受难八方支援~所以:D ~

TOP

引用:
原帖由 卖哥 于 2007-8-12 00:45 发表
Cell的问题在于它是非对称的,给PPE跑得东西不会因为PPE忙、SPE空闲就能分配过去,反过来也一样。
现在CELL已经可以逐步将PPE做的一些事情交给一个SPE去做,有SPE去分配其他SPE。

TOP

引用:
原帖由 zhangjingy 于 2007-8-12 08:56 发表


现在CELL已经可以逐步将PPE做的一些事情交给一个SPE去做,有SPE去分配其他SPE。
这儿都是高人,话说您这样的就别……。
我至少知道自己不懂的要虚心学着。

TOP

引用:
原帖由 zhangjingy 于 2007-8-12 08:56 发表


现在CELL已经可以逐步将PPE做的一些事情交给一个SPE去做,有SPE去分配其他SPE。
天师,你不装能死吗?
你来告诉我这个技术平庸人士,如何让PPE控制一个SPE将任务分配给同级的其他SPE?
引用:
原帖由 aeondxf 于 2007-8-12 02:18 发表

话说lu的sf开了一个群,貌似像联盟军那样一方受难八方支援~所以:D ~
我便是那个群下的受害者啊 :D
就是一个小P孩搞起来的东西,还不如蛋疼群讨论的东西好。

TOP

发新话题
     
官方公众号及微博