» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] 关于nx构想的一些分析

posted by wap, platform: 红米Note3
引用:
原帖由 @u571  于 2016-7-29 16:52 发表
不可能,tegra K1都比WIIU强多了,X1至少是WIIU三倍机能
这么说吧,你觉得ps3是几倍psv,ps4是几倍nx


TOP

引用:
原帖由 yfl2 于 2016-7-29 17:03 发表
posted by wap, platform: 红米Note3
这么说吧,你觉得ps3是几倍psv,ps4是几倍nx
PS3性能至少是PSV的10倍以上,而且PSV很多桌面API根本不支持,这个都没法用倍数来衡量

PS4 GPU部分纯单精度浮点性能是tegraX1的3.6倍,考虑到GCN浮点性能对比MAXWELL实际游戏性能要打折,撑死了2.7倍。CPU部分差距更小,1.6Ghz的美洲豹也就能跟2Ghz的A57/A72玩玩

而且tegraX1比PS4支持的API更全。



TOP

posted by wap, platform: 红米Note3
引用:
原帖由 @u571  于 2016-7-29 17:11 发表
PS3性能至少是PSV的10倍以上,而且PSV很多桌面API根本不支持,这个都没法用倍数来衡量

PS4 GPU部分纯单精度浮点性能是tegraX1的3.6倍,考虑到GCN浮点性能对比MAXWELL实际游戏性能要打折,撑死了2.7倍。CPU部分差距更小,1.6Ghz的美洲豹也就能跟2Ghz的A57/A72玩玩

而且tegraX1比PS4支持的API更全。
能说一下psv和ps3的浮点数据么


TOP

posted by wap, platform: 红米Note3
PS VITA SGX543 MP4+ 45nm 400 MHz 51.2
Dreamcast PowerVR2 CLX2 250nm 100 MHz 1.4
XBOX XGPU (NV2A) 150nm 233 MHz 20
XBOX360 ATI R500 Xenos 90/65/45nm 500 MHz 240
XBOX ONE AMD Radeon GCN(768 Cores) 28nm 853 MHz 1311.5
PlayStation 2 GS 180/150/90nm 147 MHz 6.2 (EE+GS)
PlayStation 3 RSX (NVIDIA G70) 90/65/45nm 550 MHz 228.8
PlayStation 4 AMD Radeon GCN(1152 Cores) 28nm 800 MHz 1840
N64 SGI RCP 350nm 62.5 MHz 0.1~0.2
GameCube Flipper 180nm 162 MHz 8
Wii ATI HollyWood 90nm 243 MHz 12
Wii U ATI RV770 40nm 550 MHz 352
Ouya Geforce ULP x 12(Tegra 3) 40nm 520 Mhz 12.5
Nvidia ShieldM.O.J.O Geforce ULP x 72(Tegra 4) 28nm 672 MHz 96.8

TOP

引用:
原帖由 yfl2 于 2016-7-29 17:14 发表
posted by wap, platform: 红米Note3
能说一下psv和ps3的浮点数据么
PS3的RSX=Vertex Shader
10 FP x 8 Shader x 550MHz = 44GFLOPS

Pixel Shader
8 FP x 24 Shader x 550MHz = 105.6GFLOPS

总共为44GFLOPS + 105.6GFLOPS = 149.6GFLOPS

(注:未计算RSX中mini FPU数据)


SGX543MP4+=USSE2x8

2fpx8x550mhz=8.8GFLOPS

仅就单精度浮点能力而言,同频率SGX543mp4+不到RSX的Pixel Shader十分之一。(Vertex Shader不说了)

CPU我就更不用说了,300-400mhz的Cortex-A9连跟CELL比较的意义都没有,几十倍差距都抬举了

TOP

posted by wap, platform: 红米Note3
PS3用RSX和SGX543MP4+单精度浮点性能比较 只看楼主

1# 66666
收藏 2011-1-28 07:40
本帖最后由 66666 于 2011-1-28 07:42 编辑

PS3的RSX=Vertex Shader
10 FP x 8 Shader x 550MHz = 44GFLOPS

Pixel Shader
8 FP x 24 Shader x 550MHz = 105.6GFLOPS

总共为44GFLOPS + 105.6GFLOPS = 149.6GFLOPS

(注:未计算RSX中mini FPU数据)


SGX543MP4+=USSE2x8

2fpx8x550mhz=8.8GFLOPS


仅就单精度浮点能力而言,同频率SGX543mp4+不到RSX的Pixel Shader十分之一。(Vertex Shader不说了)

SONY说同样的材质,同样的多边形,同样的shader能直接跑在PSP2上,我们拭目以待。

TOP

不太懂你们硬件大神。我只知道,如果没有wiiu我可能永远没法有跟家里人玩马里奥捉人,以及类似的游戏体验。

TOP

引用:
原帖由 yfl2 于 2016-7-29 17:29 发表
posted by wap, platform: 红米Note3
PS3用RSX和SGX543MP4+单精度浮点性能比较 只看楼主

1# 66666
收藏 2011-1-28 07:40
本帖最后由 66666 于 2011-1-28 07:42 编辑

PS3的RSX=Vertex Shader
10 FP x 8 Sh ...
事实证明了我当年的说法,PSV和PS3差距巨大,除了2D游戏和本身画面素质就很烂的玩意,PS3/PSV压根就没有什么互换性。

这么烂的硬件,当然会被欧美厂商抛弃,要知道当年PSP的GTA销量也是非常高。

TOP

posted by wap, platform: 红米Note3
引用:
原帖由 @u571  于 2016-7-29 17:40 发表
事实证明了我当年的说法,PSV和PS3差距巨大,除了2D游戏和本身画面素质就很烂的玩意,PS3/PSV压根就没有什么互换性。

这么烂的硬件,当然会被欧美厂商抛弃,要知道当年PSP的GTA销量也是非常高。
hello?psv看gpu浮点是ps3多少?能不能不要空对空啊?

TOP

GPU浮点值还是看这里吧,比自己算好多了,虽然也没啥用
http://kyokojap.myweb.hinet.net/gpu_gflops/
常见的移动端处理器瓶颈在CPU而不是GPU
wiiU和TK1浮点接近,然而wiiU上的无双和战斧上的无双一比就看出差距了
如果说IBM的单核是intel core级别,美洲豹是AMD X2级别,移动端就是intel 奔腾4级别
别看前面两个只有1.几G,后面那个2.几G也没法和前两个相比
CPU瓶颈最常见的问题就是AI弱、帧数低、远景糟糕,NV自己的TX1主机也验证了这点,空有上代主机2倍以上浮点能力也没用
NV为什么要研发丹佛这种大核芯,就是因为他自己都知道移动端常见的架构不顶用,当然安卓这SB系统没4核以上根本不能流畅,结果2核64版的TK1成了笑话,这次TP1,NV干脆全都整合进去
所以,任天堂如果直接用TX1,那只能呵呵了

TOP

引用:
原帖由 yfl2 于 2016-7-29 17:42 发表
posted by wap, platform: 红米Note3
hello?psv看gpu浮点是ps3多少?能不能不要空对空啊?
你贴的移动GPU数据里面包括FP16,当然android/IOS本身也是以FP16为主当然无可厚非,你要让第三方把桌面上FP32精度渲染引擎用FP16来做等于重新开发一款游戏

至于FP32我上面已经写明了,差距巨大。

而且PS3上仅仅CELL自己单精度就有155.82Gflops,我说PS3性能是PSV10倍都算是很客气的说法。

TOP

引用:
原帖由 samusialan 于 2016-7-29 18:44 发表
GPU浮点值还是看这里吧,比自己算好多了,虽然也没啥用
http://kyokojap.myweb.hinet.net/gpu_gflops/
常见的移动端处理器瓶颈在CPU而不是GPU
wiiU和TK1浮点接近,然而wiiU上的无双和战斧上的无双一比就看出差距了 ...
真是好笑,光荣一个压根就是手游版移植的垃圾能代表什么?WIIU本身自己CPU频率才1.2Ghz,而且搞笑的是构架居然是1997年的PowerPC 750,水果G3用的就是这个玩意

WIIU说句实话,CPU性能还不如现在的红米。

我之前贴的那个网游用tegra K1在1536x2048分辨率下能跑30帧,WIIU来跑下试试?

[ 本帖最后由 u571 于 2016-7-29 19:00 编辑 ]

TOP

另外美洲豹这破上网本CPU就不要吹了,自己看看农企宣传对比



能耗比大大低于A57,PS4 CPU能比tegraX1强多少?呵呵厚
附件: 您所在的用户组无法下载或查看附件

TOP

posted by wap, platform: 红米Note3
算等.
GPU:
      索尼并没有公布PowerVR SGX543MP4+的工作频率,故以下以ImgTec官方标称为标准,即200MHz,同时由于索尼在官方介绍中并没有明确+的含义,所以以下参数介绍均基于ImgTec的原生数据.PowerVR SGX543隶属于PowerVR 5XT系列,5XT系列较于5系列的特点主要有:采用USSE2(可拓展着色引擎v2)核心架构,在原USSE的基础上加强了矢量操作和co-issue的支持;改良区块(tile)处理减少内存带宽占用,提升setup限制应用的性能;2倍浮点性能和2倍隐藏面消除性能;增强triangle setup使得三角形吞吐量提升50%;提升MSAA性能;更高级的色彩空间处理和伽马校正;进一步优化OpenVG;改良缓存和MMU.
      PowerVR SGX543采用统一着色器架构,TBDR渲染架构,支持隐藏面消除特性,每核心包含4个USSE2单元,2个TMU,四核心200MHz下多边形运算可达1.33亿/秒,像素填充率40亿/秒(像素填充率由于不可见像素消除特性为x2.5后的等效值),支持OpenGL ES 2.0/1.1,OpenVG 1.x等图形接口,符合OpenCL的GPGPU标准.每个USSE2核心每周期执行一次vec4 MAD操作,每MAD伴随2次浮点运算,此外USSE2支持一次额外的ADD操作,每ADD一次浮点运算,浮点均为FP32,计算一下四核PowerVR SGX543MP4理论浮点运算量为4 x (4 x 4 x 1MAD/Clock x 2FLOPS/MAD + 4 x 1 x 1ADD/Clock x 1FLOP/ADD) x 200MHz=28.8GFLOPS,简单一点为四核心 x 36FLOPS/Clock x 200MHz.

TOP

2. PowerVR SGX系列2.1 旧的SGX5系列包括SGX530/531/535/540/545,其Shader计算单元为USSE。USSE一个周期,可以对4个FX10(10bit的定点数,比FP16精度更低) 或者 2个FP16 或者 1个FP32 进行MADD操作。由于FP32才算是正常意义上的FLOPS,所以其性能每周期2 FLOPS。但是当两个FP32的操作共享一个操作数时,USSE也可以在一个周期里处理,此时就是2个FP32的MAD操作,4 FLOPS。所以,USSE的FP32性能,每周期为2~4 FLOPS。主流SGX5 GPU运算能力:SGX530, 2USSE,200MHz,0.8~1.6 GFLOPSMTK的SGX531,2USSE,300MHz,2USSE,1.2~2.4 GFLOPS三星蜂鸟SGX540,4USSE,200MHz,1.6~3.2 GFLOPSOMAP4460,ATOM Z2460的SGX540 400MHz, 4USSE,3.2~6.4 GFLOPS不过在FP16下,也就是大多数游戏的Pixel Shader精度下,相比FP32的最差情况下就能翻倍了。同样在更低精度的FX10下,还能再翻倍。
2.2 SGX 5XT系列包括SGX543/544/554,和它们的各种多核版本。其Shader计算单元为USSE2。USSE2不像之前那样了,是个Vec4+scalar的架构,单周期支持4个FP32的MAD操作,外加一个简单的scalar操作(ADD/MUL),这样跟Adreno一样,每周期 9 FLOPS。单个543/544包含4个USSE2,性能基本一样,544多一些DX的API支持。单个554则包含8个USSE2。主流SGX5XT GPU运算能力:iPhone 4S里的543MP2,2×4=8个USSE2,200MHz,14.4 GFLOPSOMAP4470里的单个544,384MHz,4USSE2,跟上面类似全志A31里的544MP2,所谓的8管线就是8USSE2,300MHz,也有21.6 GFLOPSiPad3里的A5X,543MP4,16USSE2,250MHz,36 GFLOPSiPad4的A6X,554MP4,32USSE2,280MHz,就突破80 GFLOPS了

TOP

发新话题
     
官方公众号及微博