小黑屋
查看详细资料
TOP
银河飞将
猛将兄
版主
请叫我猛将兄......
禁止访问
原帖由 9562 于 2007-12-20 12:12 发表 ngc显存3m ps2显存4m dc显存8m ls应该去考古了
[gamecube特性] cpu: ibm power pc "gekko" 制造工艺:0.18微米铜连线工艺 时钟频率:405 mhz cpu运算速度925 mips (dhrystone 2.1) 内部数据精度:整数--32-bit integer;浮点--64-bit 外部总线宽度:每秒1.6 gb(峰值);32-bit 地址总线,64-bit数据总线,运行于202.5 mhz 内部cache:l1-指令cache 32 kb,l1-数据cache 32 kb (8 路); l2:256 kb (2路) gpu - "flipper" (系统lsi) 制造工艺:nec 0.18微米嵌入式embedded dram工艺处理 时钟频率:202.5 mhz 嵌入式帧缓冲(embedded frame buffer:大约是2 mb(也许是2.1mb),潜伏期:5 ns (1t-sram) 嵌入式材质高速缓冲(embedded texture cache): 大约是mb,潜伏期::5 ns (1t-sram) 材制读取带宽:每秒12.8 gb(峰值) 主内存带宽:每秒3.2 gb (峰值) 彩色精度、z buffer精度:24-bits 画面特效:雾化、子像素抗失真(subpixel anti-aliasing)、8个硬件光照、阿尔法混合、虚拟材质设计、多重贴图/凹凸/环境映射、mipmap、双线性过滤、三线性过滤、实时材质解压缩(s3tc格式)等 其他:实时display list 解压缩、硬件运动补偿能力 音频能力(gamecube的音频处理器是位于flipper内的一枚dsp) 声音处理器:特制的16-bit dsp 音频指令内存 8 kb ram + 8 kb rom 音频数据内存:8 kb ram + 4 kb rom 时钟频率:101.25 mhz 最大同时发声数:adpcm格式的话是64声道 取样频率:48khz 系统浮点运算能力:13.0 gflops(峰值,cpu+几何引擎+硬件光照) 实际显示能力: 每秒6百万到12百万多边形(这是实际游戏中的性能,包括了复杂的模型以及贴图等) 系统主内存:24 mb,潜伏期:10 ns或者更低(1t-sram)memory:16 mb (100 mhz dram) 光盘驱动器::cav (恒定角速度,constant angular velocity),传输速度为16mbps到25mbps,平均访问时间为128ms 媒体:8cm nintendo gamecube disc,基于matsushita的optical disc技术,最高容量为1.5gb 输入/输出:4个游戏控制器接口;2个digicard插槽;1个模拟av输出口;1个数码av输出口;2个高速串行接口;1个高速并行接口 电源:交流转直流适配器,12 v x 3.5 a 主单元尺寸:150mm(w) x 110mm(h) x 161mm(d) [整合了artx图形内核的flipper芯片] gamecube的心脏来自于atrx公司设计的图形芯片,而这枚图形芯片已经被整合到名为"flipper"的系统lsi(lsi,大规模集成电路)中了。flipper集成了超过5100万只晶体管,相对而言,ps2的graphics synthesizer集成的晶体管数目是4300万,而xbox图形内核的xgpu估计会拥有6000万只以上。本质上来说,晶体管的数目只能说明芯片的复杂程度,并不能说明其性能的强弱。因此,如果光光说5100万只晶体管这个数目的话只能说明flipper是一块集成度很高的小芯片而已。 除了渲染引擎外,在这枚芯片中,包含了超过3mb的嵌入式1t-sram、s3tc硬件解压电路、一个硬件几何t&l引擎以及一枚可编程音频芯片。把这一切加在一起的目的主要是为了把开发的困难降低到最低。当游戏代码穿越gamecube的电路时,数据流以及运算就会自动地产生。相对而言,ps2的开发人员就必须针对ps2的特点(超大带宽、低容量缓冲、simd/vliw向量单元、16个并行贴图单元的graphics synthesizer)自己编写诸如材质压缩、抗失真(anti-aliasing)以及光照的复杂程序和算法。 软件创作者可以让gamecube的图形芯片可以欣然地按照其意愿来运作。artx公司的tim van hook声称,gamecube是全自动的(gamecube is automatic)。他说:"我们以小汽车为例,gamecube可以说跟全自动驾驶的小汽车有几分相似。"你只要加满汽油,然后拍拍它的屁股,它就可以载着你自动到你想去的地方了。这意味着,gamecube开发人员可以把游戏设计真得如他们所希望的那样,把更多的精力投入到游戏意念的创新。嗯,对了,他们可供休息的时间也更多了。 注解 pll:锁相环(路) efb:内部帧缓冲 etm:内部材质高速缓冲 tf:材质过滤器 tc:材质坐标发生器(texture coordinate generator) tev:材质环境发生器 rasx:光栅器(渲染引擎或者说贴图引擎/流水线) c/z:彩色/深度运算器(color/z calculator,hyper-z运算器?) pec:像素拷贝引擎(pixel copy engine) su:三角形设定引擎(triangle setup) cp:指令处理器(command processor,实时display list解压引擎?) dsp:数字信号处理器(digital signal processor,主要负责音频处理等) xf:几何引擎(geometry engine,负责硬件t&l运算) nb:输入/输出界面(input/output interface) flipper中的1t-sram是什么? 3mb的1t-sram够用吗? 让gamecube的图形引擎有强大动力的一个重要原因就是是其内嵌的3.1mb 1t-sram(3.1mb这个容量目前来说还只是根据任天堂的公告所做的初步推测,确切的容量还没有正式公布,不过我们相信真实的产品不会离这个数字有很大的变化--除非任天堂在耍花招)。 1t-sram这个名字的来源是出自其设计公司--mosys的,其实,这个所谓的sram真正来说,应该是基于single-transistor dram(单-晶体管dram)的cells(组元)。按照mosys公司的白皮书("mosys explains 1t-sram technology--unique architecture hides refresh, makes dram work like sram",作者:peter n. glaskowsky)解释,在同样都是64mbit的情况下,1t-sram的管芯(die)面积只是比sdram大大约10%到15%,但是却可以比同样容量的正式sram小70%!在某种角度上来看,1t-sram就是ps2 graphics synthesizer里的edram。不同的是,flipper的内部集成了硬件s3tc材质压缩单元,而ps2的gs则没有直接提供该功能,必须借助emotion engine中的ipu以及开发人员的编程(也就是所谓的软件方式)才能进行材质的解压缩,因此,flipper的1mb 1t-sram texture cache在某些情况下(例如24位材质)是可以达到最高6mb左右的效果。 在filpper中,这3.1mb的1t-sram被划分为两大块,而较小一块--即1mb的texture cache(材质高速缓冲,在上面的管芯图中,被标记为etm的部分)是其中最为重要的一块。为了达到也许是artx公司(负责设计)与nec公司(负责制造)在脑力大激荡(brainstormed,其实我比较情愿把它翻译为智力大激荡)后所要求实现的执行效能,这块1mb的texture cache被划分为512个banks(你可以把它理解为512个存储仓),不过,这512个banks中每次只能够提供32个banks进行同时的访问。另一块的1t-sram(在前面的flipper管芯图中,被标记为efb,是embedded frame buffer的缩写)的容量大约是2.1mb左右,是作为帧缓冲(frame buffer)和深度缓冲(例如z-buffer)使用的,为了降低开发人员的困难,这2.1mb的efb只有128个banks,幸运的是,在gamecube中,这部分的1t-sram并不需要提供非常非常高的效能,因此128 banks是足够的了。 任天堂在宣布gamecube的当天就推出了两段star wars: rogue squadron,这些录像都是在gamecue真实渲染的情况下实时录制的。 为gamecube提供声音开发软件--musyx的第五元素公司(factor 5)总裁julian eggebrecht在德国电视游戏机站点http://www.maniac-online.de/上说道: 1、这两段画面都只是使用了gamecube硬件机能的50%; 2、渲染速度都达到了60fps,使用了双缓冲、真彩色渲染、全屏幕抗锯齿以及消闪烁; 3、x-wing战机使用了30,000个多边形、飞行员使用了4,000个多边形; 4、第二个死星的表面虽然看似简单,但是却已经动用了300个多边形,每个面都使用了512x512的材质,达到与正式电影中1:1的规模。在这段演示片断中,你会看到总共25个这样的"星球"(要知道,在故事中,每个死星都要耗时2年才能造好)。除此以外,你还可以在屏幕上看到70架钛战机、x-wing战机。总括而言,在60fps的情况下,每帧画面大约动用了200,000个多边形,而且还使用了8个lighting(光源)以及光泽、污垢和凹凸贴图映射; 5、gamecube可以在同一个周期里实现一下贴图特效:alpha(阿尔法混合)、 bump mapping(凹凸映射)、 gloss mapping(光泽映射)、specular highlights(镜面高光)等。gamecube可以在一个周期里完成8层贴图。 6、2mb的帧缓冲是一个渲染缓冲(也就是我们所说的后缓冲--back buffer),当一帧画面在这个缓冲完成了渲染以后,就会被(像素拷贝引擎--pec,pixel copy engine)发送到主内存中。需要注意的是,在这帧画面被发送到主内存以前,抗失真(anti-aliasing)以及消闪烁(deflickering)已经完成了。 7、1mb的texture cache会在渲染的时候自动装填材质数据,而这个交换动作是由t&l引擎触发的。经常使用的材质会被"锁定"在cache中。 8、a-memory主要是被音频处理器(也就是flipper中的dsp)作为一个缓冲使用,不过还可以被其他不需要高速缓冲的部件使用。 9、2mb(也许是2.1mb)的帧缓冲只会包含当前正在被渲染的画面帧数据以及z-buffer的数据,而double/triple buffer则是存放在主内存中的,这是因为gamecube的视频dac(数模转换器)设计的非常奇特,可以直接跑到主内存中获取这些画面数据。如果要渲染一帧画面的话,多边形数据(或者说顶点数据)会被发送到t&l引擎(flipper管芯图中被标记为xf的部分),t&l引擎会根据实际的情况自动在texture cache中装载/交换所需要的材质。接下来,被压缩的材质就会被解压,因此未压缩的材质决不会占据其宝贵的内存空间。 出色的硬件光照性能 值得注意的是,如果真的是像julian eggebrecht所指出的那样,那么这也就意味着gamecube能够在8个光照的情况下,每秒向渲染引擎/流水线递送1200万个多边形。这的确是一个让人感到十分惊奇的吞吐量,要知道,nvidia的专业级图形芯片quadro 1也只能在8个光照的情况下每秒提供200万个多边形而已。当然,我们认为gemecube的这个几何性能相对于微软的xbox来说应该会存在一定的性能差距。 几何顶点压缩功能 在前面的gamecube特性列表中,相信你已经在看到了一个这样的东东:实时display list 解压缩,这意味着gamecube可以用压缩的形式来保存多边形,并且只有在t&l引擎需要进行对其运算、渲染的时候才对其进行解压。任天堂对这个特性没有进行任何更深入的说明,包括压缩方法以及压缩比率,不过我们认为,即使是1/2的压缩比率也将是十分显著的。 gamecube的系统主内存 gamecube中,最让人惊讶的就是其24mb 1t-sram的主内存。虽然在前面我已经对该内存给出了一些介绍,但是我相信这是不够的。为了让大家对该技术有更多的认识,先让我们来看看研发该内存的mosys的公司背景吧: 1991年成立,目标是专门研发基于mosys具创新意念体系的前卫内存技术; 1995年,领先推出mdram体系产品,并且被应用到曾氏公司的et6000显示芯片产品中; 1998年,发布1t-sram标准sram功能的设备; 该公司已经获得了30个专利并且有更多的专利技术在申请中; mosys公司是在1999年正式发布1t-sram技术,并且发出了首个相关的授权。在这以后,不少公司都宣布采用该内存技术作为其soc中的嵌入式内存方案。该公司的产品有一个很大的特点,那就是mulitbank体系,该技术在et6000显卡中引入的时候,造成了很大的轰动(这是因为采用mdram的et6000对于1995年的pc应用软件来说,其显示性能几乎可以说是最快的)。 在以往,芯片中集成的内存主要包括了edram以及sram,前者注重容量,成本较低、速度较慢;后者注重速度,集成度低的多,成本相对也高的多。 而mosys的1t-sram则兼顾了两者的优点:大容量、高速度、低耗电: 在标准逻辑内核中,只需要1/2~1/3传统6t-sram的面积 在标准逻辑内核中,只需要1/4传统6t-sram的电耗 同样的容量下,可以提供10倍于传统edram的性能 按照任天堂方面公布的资料来看,gamecube 24mb的1t-sram系统主内存潜伏期总共只有10纳秒甚至更低,对于系统在访问非线性存放在其中的数据时又非常明显的帮助(例如复杂的ai运算)。而这个10纳秒的潜伏期对于材质压缩数据则没有什么帮助,因为材质压缩数据是线性存放的,幸运的是,这24mb 1t-sram除了潜伏期低以外,其带宽也达到了3.2gb/s,加上flipper内部的1mb texture cache,gamecube应该不会为其材质访问效能担心。 24mb的容量对于作为系统主内存来说,的确显的少了些,不过任天堂也并没有确切给出具体的细节,因此,明年的gamecube系统主内存容量将有变动的可能。对了,gamecube还有16mb 100mhz sdram的a-memory为那些不需要1t sram那么高速的设备(例如声卡、光盘驱动器)提供缓冲服务。 [gamecube的其它方面] gamecube的存储媒体--专用的1.5gb光盘非常奇特,光盘内圈有很大的一段似乎没有数据,估计主要是为了提高传输速率吧(因为它的驱动器采用的是cav方式,越是靠光盘外侧的数据,传输速度越快,但是靠内的数据在传输时却是最慢的)。 gamecube的mpu是由ibm制造的gekko,内里包含了一个powerpc cpu,使用0.18微米铜连线工艺制造,运行于400mhz,至于是否拥有类似ps2 emotion engine中专门负责ai、物理运算的向量单元就不得而知了(至于ps2 emotion engine中的vpu1部分在gamecube中已经作为t&l引擎整合到了flipper中了)。其他的细节大家可以看看前面列举的特性清单。
天外飞仙
摄影组
原帖由 jinyibo 于 2007-12-21 15:37 发表 REBIO里一个灯一个蜡烛就是一个光源,4代的火把,NGC版可以打掉,PS2不行,光源数目有限。