» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 19 12
发新话题
打印

[新闻] nVidia Kal-El GPU性能演示

其实我说的是Vertex Frequency Stream Divider,DX9.0C就支持的东西,tegra3不支持DX10还属于9.0C范畴


TOP

引用:
原帖由 卖哥 于 2011-2-23 13:37 发表
那需要有GS的吧,嗯,也许Kal-El是G80架构的了,支持DX10。
如果是geo-instancing,那么和GS是无关的,连ATI R300都支持的东西。
这玩意主要是为了降低Win32下DX函数的调用次数从而减小由于user mode<->kernel mode而产生的CPU开销。从这个角度说,对于Win32下的OpenGL必要性就不是很大,对Console上的DX必要性也不是很大。
顶点复用是由post vs cache支持的,因为存在若干三角形共用顶点的情况(二维情况下理想情况是平均两个三角形使用1个顶点)所以当绘制顺序优化合理时可以复用post vs cache中的顶点而不用重新计算,这个可以确实节省vertex shader开销。不过看这个演示,单个模型复杂度不高而是人物众多,不同位置的人物自然你不可能顶点复用。再者post vs cache这个已经是很老的技术(geforce1时好像就有了)大概现在的硬件都有了所以我是觉得没有拿出来说的必要。
就支持GS/Tessellation的硬件来说,还有一种优化方法是把骨骼变换等相对复杂的运算作用于极简模上面,然后再GS/Tessellation成正常精度模型,这理论上也可以节约资源,不过用GS效率不见得好。而且上面说了这个demo模型看起来也不复杂。
因此,这个demo需要的是实打实的顶点运算能力与光栅化能力。从这个角度上讲,SGX的光栅化性能似乎不差,不过顶点运算能力不见得很好,毕竟顶点运算靠的是单精度浮点运算。不过SGX543的USSE2似乎是Vector-2的单精度运算能力,这还是有效的,毕竟顶点运算中有大量的vector运算,用SOA不见得比AOS有多少效率上的优势。峰值更高的vector方式比峰值低的scalar要更有效。



TOP

543应该不是USSE2的,544才是。


TOP

引用:
原帖由 卖哥 于 2011-2-23 14:19 发表
543应该不是USSE2的,544才是。
imagination的pdf似乎是把SGX543算到Series5XT里面的。
http://www.imgtec.com/factsheets ... amily_%5B3.1%5D.pdf

[ 本帖最后由 hourousha 于 2011-2-23 14:28 编辑 ]

TOP

 19 12
发新话题
     
官方公众号及微博