打印

[新闻] Hardocp的下一世代主機規格謠言

hourousha

魔王撒旦

帖子: 5249
精华: 0
积分: 27921
激骚: 435 度
爱车
主机
相机
手机
注册时间: 2004-1-7

TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前离线

16^# 大中小发表于 2011-7-8 15:34 只看该作者

引用:

原帖由 u571 于 2011-7-8 13:48 发表
如果搞融合概念的话，拿SPE来处理shader，买个powerVR的核心来做光栅化都比用AMD GPU上算。
如果PS4采用28nm的话集成32甚至48个SPE都够了

48个SPE得什么频率才能在傻多速应用方面赶上5870的那320组VLIW-5D？
AMD的融合概念实际实现还是要靠OpenCL这种东西把傻多速的工作由GPU分担一些，当然由于结构的原因可以避免一些不必要的data-transfer，但把GPU的‘部分’傻多速工作交给CPU或协处理器，并不见得合适或合算不是么？比如TMU部分如何处理？TMU和ALU部分的同步怎么处理？

TOP

u571

禁止访问

帖子: 31338
精华: 0
积分: 50373
激骚: 667 度
爱车
主机
相机
手机
注册时间: 2002-9-11

TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前离线

17^# 大中小发表于 2011-7-8 16:04 只看该作者

引用:

原帖由 hourousha 于 2011-7-8 15:34 发表

48个SPE得什么频率才能在傻多速应用方面赶上5870的那320组VLIW-5D？
AMD的融合概念实际实现还是要靠OpenCL这种东西把傻多速的工作由GPU分担一些，当然由于结构的原因可以避免一些不必要的data-transfer，但把GPU的 ...

4G下48个spe单精度浮点也有1.5T，虽然比5870理论性能差不少但是使用灵活性和效率比VLIW-5D高的多

OpenCL只是看起来很美好，实际使用难度比可直接使用C/C++的SPE高的多。

集成powerVR核心做TMU纹理读取和ROPs，数据共享可通过L3，SNB就是个好例子。

总而言之GPU能做的事SPE也能做，基础power不高但效率更高更容易使用。傻快的工作你AMD能做powerVR也能做。

如果SONY真的使用融合概念且赛了个5870在DIE里面，那SPE根本就没必要存在，反之依然。就向下兼容性和成本而言，走强化SPE外挂powerVR更合理。

TOP

三派聚义

小黑屋

帖子: 11094
精华: 0
积分: 13178
激骚: -29 度
爱车
主机
相机
手机
注册时间: 2002-5-25

发短消息
加为好友
当前离线

18^# 大中小发表于 2011-7-8 16:07 只看该作者

这些对我毫无意义啊，玩上游戏实际效果才是真实感受。

TOP

hourousha

魔王撒旦

帖子: 5249
精华: 0
积分: 27921
激骚: 435 度
爱车
主机
相机
手机
注册时间: 2004-1-7

TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前离线

19^# 大中小发表于 2011-7-8 16:39 只看该作者

引用:

原帖由 u571 于 2011-7-8 16:04 发表
4G下48个spe单精度浮点也有1.5T，虽然比5870理论性能差不少但是使用灵活性和效率比VLIW-5D高的多
OpenCL只是看起来很美好，实际使用难度比可直接使用C/C++的SPE高的多。
集成powerVR核心做TMU纹理读取和 ...

SPE只能直接操作Local store——这也是SPE之所以效率高的原因之一。而Local store的存取需由DMA编程完成。再者GPU中使用类似CMT的多线程结构，你打算怎么把它和SPE有效联系起来啊？随便给一段shader，假如有几处indirect texture lookup，怎么办？
OpenCL确实不如直接使用原生C/CPP处理通用程序方便，原因正在于GPU的结构适应于图形相关方面的运算。而要把这种结构运用于通用运算中，自然有这样或那样的不便和限制。道理反过来同样成立：你把ALU等运算单元剥离出去交给CPU运算，CPU这东西执行通用运算比较方便自由，但执行图形相关运算就是另外一回事，举个简单例子：GPU的话，你只管写shader就完事了，而SPE的话，哪怕全是ALU运算的shader，最起码你得写成SOA（struct of arrays）结构的程序才能发挥SPE的威力吧？其他的诸如Local Store和线程调度方面也不能不管吧？这难度显然比用GPU高不是么，这还不算要和TMU打交道的情况。
说到SPE图像辅助处理，基本就是Image space processing范畴，因为此时不需要TMU的参与，直接把ImageBuffer（或G-Buffer）分块交给各个SPE处理就可以保证很好的并行性（简单的fork-join嘛）。但想同时保持CPU对SPE的完整控制性又想让SPE去取代GPU中的ALU合作完成GPU的所有功能，在我看来至少短期内不现实。如果把SPE和GPU做紧密的绑定倒可以，但那还是SPE么？这不就走回GPU的老路了么？

就我看法，由于下代游戏机的渲染体系依然和本代相同（部分使用ray-trace是可能的）。所以并不需要过高的CPU Raw-power，主要还是强化GPU为主。什么48SPE必要性不大。CPU的主要工作依然是场景管理、AI、物理运算等。然后保持Console一贯的CPU-GPU间高速通信的特性就OK。

[ 本帖最后由 hourousha 于 2011-7-8 16:47 编辑 ]

TOP

君

混世魔头

帖子: 2520
精华: 0
积分: 23752
激骚: 299 度
爱车
主机
相机
手机
注册时间: 2008-6-10

TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2016新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆ TGFC 2019新年勋章☆☆☆☆ TGFC 2020年度勋章☆☆☆☆

发短消息
加为好友
当前离线

20^# 大中小发表于 2011-7-8 16:53 只看该作者

引用:

原帖由 三派聚义 于 2011-7-8 16:07 发表
这些对我毫无意义啊，玩上游戏实际效果才是真实感受。

+1

TOP

u571

禁止访问

帖子: 31338
精华: 0
积分: 50373
激骚: 667 度
爱车
主机
相机
手机
注册时间: 2002-9-11

TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前离线

21^# 大中小发表于 2011-7-8 17:14 只看该作者

引用:

原帖由 hourousha 于 2011-7-8 16:39 发表

SPE只能直接操作Local store——这也是SPE之所以效率高的原因之一。而Local store的存取需由DMA编程完成。再者GPU中使用类似CMT的多线程结构，你打算怎么把它和SPE有效联系起来啊？随便给一段shader，假如有几处in ...

这不就成了一个多核PPE+5870规模的GPU，翻版的APU了嘛

游戏机采用这种设计没有太大意义

TOP

hudihutian

小黑屋

帖子: 43221
精华: 0
积分: 46044
激骚: 1462 度
爱车
主机
相机
手机
注册时间: 2006-6-26

发短消息
加为好友
当前离线

22^# 大中小发表于 2011-7-8 17:22 只看该作者

我觉得还是塞运算单元是正途

TOP

seek

小黑屋

帖子: 6095
精华: 0
积分: 15305
激骚: 367 度
爱车
主机: ps2 ps3 wii psp nds
相机
手机
注册时间: 2009-6-16

TGFC 2016新年勋章☆☆☆☆

发短消息
加为好友
当前离线

23^# 大中小发表于 2011-7-8 17:35 只看该作者

u571分析有道理；
Console不是pc，没必要把gpu单独出来

TOP

cc0128

元始天尊

帖子: 43422
精华: 0
积分: 52619
激骚: 1708 度
爱车: 11路
主机: 3ds, xbox one
相机: ep5
手机: nexus 5
来自: 北方三线城市
注册时间: 2005-12-17

PS区大收藏家奖☆☆☆ TGFC 2018新年勋章☆☆☆☆ TGFC 2020年度勋章☆☆☆☆

发短消息
加为好友
当前在线

24^# 大中小发表于 2011-7-8 17:36 只看该作者

太给力。这帖子。学习了

TOP

csimd

小黑屋

帖子: 6078
精华: 0
积分: 2530
激骚: 15 度
爱车
主机
相机
手机
注册时间: 2008-5-21

发短消息
加为好友
当前离线

25^# 大中小发表于 2011-7-8 17:51 只看该作者

引用:

原帖由 u571 于 2011-7-8 17:14 发表

这不就成了一个多核PPE+5870规模的GPU，翻版的APU了嘛

游戏机采用这种设计没有太大意义

wiiu的设计不就是这种的弱化版么

TOP

allensakura

魔神至尊

精神分裂

帖子: 15500
精华: 0
积分: 19140
激骚: 325 度
爱车: 小綿羊
主机: 屁吸
相机: GF2
手机: 霉8
注册时间: 2007-12-16

发短消息
加为好友
当前离线

26^# 大中小发表于 2011-7-8 20:00 只看该作者

引用:

原帖由 seek 于 2011-7-8 17:35 发表
u571分析有道理；
Console不是pc，没必要把gpu单独出来

我想知道GPU不單獨出來是基於什麼理由？

TOP

asdqwe

魔神至尊

64X

帖子: 19716
精华: 0
积分: 47824
激骚: 747 度
爱车
主机: 64X
相机
手机
注册时间: 2006-7-5

TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆ TGFC 2019新年勋章☆☆☆☆ TGFC 2020年度勋章☆☆☆☆

发短消息
加为好友
当前离线

27^# 大中小发表于 2011-7-8 20:23 只看该作者

好像什么也没说·····

TOP

seek

小黑屋

帖子: 6095
精华: 0
积分: 15305
激骚: 367 度
爱车
主机: ps2 ps3 wii psp nds
相机
手机
注册时间: 2009-6-16

TGFC 2016新年勋章☆☆☆☆

发短消息
加为好友
当前离线

28^# 大中小发表于 2011-7-8 21:21 只看该作者

引用:

原帖由 allensakura 于 2011-7-8 20:00 发表

我想知道GPU不單獨出來是基於什麼理由？

只是一个朦胧的感觉而已，我也不懂，我随便瞎说几个好处吧：
1 节约两个U之间的通信时间
2 提高集成度，降低成本（这一点，PC都是各个部件组装起来的，因为不是所有人都需要自己的电脑有很强的图形处理能力，所以设计成多U更灵活组装吧）

TOP

oracle

Azrael

魔王撒旦

帖子: 8553
精华: 2
积分: 18908
激骚: 2166 度
爱车
主机
相机
手机
注册时间: 2009-4-29

发短消息
加为好友
当前离线

29^# 大中小发表于 2011-7-9 12:18 只看该作者

技术贴mark

TOP

akilla

小黑屋

帖子: 6139
精华: 0
积分: 18012
激骚: 236 度
爱车
主机
相机
手机
注册时间: 2002-11-26

发短消息
加为好友
当前离线

30^# 大中小发表于 2011-7-9 19:37 只看该作者

引用:

原帖由 allensakura 于 2011-7-8 13:25 发表
選CELL也沒什麼不好，想要用最低的面積達到最高的性能CELL是很划算的選擇
反正CPU也不用多強，夠便宜、耗電低才是重點

反而是騷泥要拿AMD的什麼GPU？不管怎麼說圖形性能不如微軟的特製產品幾乎是肯定的

至少得是GCN内核的GPU

TOP