原帖由 @Nemo_theCaptain 于 2020-4-3 20:23 发表
有个Fidelity FX CAS,已经整合到Reshade里,N卡也能用,但原理和DLSS不同,效果也差得远,没法比
原帖由 waller 于 2020-4-3 20:27 发表
posted by wap, platform: Android
那微软那个如何?据说原理和dlss类似?另外现在还要训练一个多月,如果边开发边训练,能同步或者就差个一两周么?
本帖最后由 waller 于 2020-4-3 20:28 通过手机版编辑
原帖由 mjnaur 于 2020-4-3 20:37 发表
posted by wap, platform: Android
目前没有听说过,要不是手上活太多,我还蛮想做的。不过这么牛逼的东西,应该有人在研究了
可能微软会利用DirectML做一套跨硬件的方案吧。不过那就只能在Windows上工作了,而且 ...
原帖由 @mjnaur 于 2020-4-3 20:37 发表
目前没有听说过,要不是手上活太多,我还蛮想做的。不过这么牛逼的东西,应该有人在研究了
可能微软会利用DirectML做一套跨硬件的方案吧。不过那就只能在Windows上工作了,而且只支持DX。可能我们需要自己也搞一套出来
原帖由 @waller 于 2020-4-3 21:21 发表
换言之,dml就算能接近dlss,也只有xsx能用,ps5只能用amd自己搞的,应该是这么理解的吧?
原帖由 @coolwind 于 2020-4-3 20:56 发表
看DF有关XSX的视频里提到了有关DML项目的分析,听起来应该和DLSS的思路差不多,但NV用的是硬件Tensor Cores,而RDNA2是集成到渲染管线里面的,同理两家的光追实现也是这种原理,你可以理解为NV是硬解,AMD是软硬结合,效果上肯定是NV更好,但成本也高一些,AMD的套路仍然是用比你便宜的方案实现比你差一些的效果,但你有的我也都有,DX12U就是把这些标准整合起来,各家根据自己的情况选择不同的实现方案。
原帖由 waller 于 2020-4-3 21:35 发表
posted by wap, platform: Android
nv的tpu是很难技术么?貌似现在研究tpu的公司不少,为啥amd不在架构中加入呢?按你的说法amd实际是用gpu在干tpu的事儿?
原帖由 @waller 于 2020-4-3 21:35 发表
nv的tpu是很难的技术么?貌似现在研究tpu的公司不少,为啥amd不在架构中加入呢?按你的说法amd实际是用gpu在干tpu的事儿?那不是效率会低很多而成本高很多?
本帖最后由 waller 于 202043 21:39 通过手机版编辑
原帖由 waller 于 2020-4-3 21:21 发表
posted by wap, platform: Android
换言之,dml就算能接近dlss,也只有xsx能用,ps5只能用amd自己搞的,应该是这么理解的吧?
原帖由 @coolwind 于 2020-4-3 21:47 发表
没错,AMD就是这么干的,TPU这个方案不难,AMD也能做到,之所以没做我猜测根本原因是性价比差,因为在技术方面现在的AMD是没法和NV比的,就算同样采用TPU方案,最后也无法在效果上和NV比肩,结果就是你用了同样的成本做出来的东西和竞争对手比完全没有竞争力,那怎么办,不如退一步,我用一个成本是你50%的方案去实现你70%的效果,你的东西好你卖的贵,那我的东西差一些我就便宜点卖,不差钱的找你,图便宜的找我,错位竞争,CPU市场其实一直也是这么玩的,只不过现在有点要翻身的意思了。
原帖由 waller 于 2020-4-3 21:59 发表
posted by wap, platform: Android
问题是用gpu干tpu的事不可能成本更低啊?就像用cpu干gpu的事一样,通用处理器是不可能和专用处理器比效率的。gpu和tpu比起来显然更加“通用”,我看网上数据tpu是gpu能效比的60倍? ...
原帖由 @coolwind 于 2020-4-3 22:04 发表
这方面我不是专家,就不瞎猜了,但AMD不会傻到放着便宜好用的技术不要,自己搞个成本更高的方案,这么做一定有他的理由,而且在芯片面积和成本上应该是有优势的,这个最终会在次世代游戏主机和AMD的零售显卡上有所体现,等下半年就全清楚了,我能说的就是DX12U已经把最新的GPU技术都囊括了,AN两家的新品都会支持全部特性,只是实现方式和效果上有所区别。
原帖由 waller 于 2020-4-3 21:59 发表
posted by wap, platform: Android
问题是用gpu干tpu的事不可能成本更低啊?就像用cpu干gpu的事一样,通用处理器是不可能和专用处理器比效率的。gpu和tpu比起来显然更加“通用”,我看网上数据tpu是gpu能效比的60倍? ...
原帖由 @mjnaur 于 2020-4-3 22:13 发表
光栅化和光线追踪,在填充每个像素时所需要的计算量有非常大的区别,光栅化的计算量要远小于光追。因此,在使用光栅化时,DLSS所能达到的加速实际上并没有太多。而为此牺牲更多的die size和功耗是不划算的。
并且AMD之前也没搞过DL算法在graphic pipeline中的运用,所以也没这个意识。老实讲,在RTX发布的时候,往这游戏卡里加tensor core这种行为我一直觉得很诡异,游戏里会用神经网络的游戏屈指可数。直到DLSS出来时才知道原因。
原帖由 waller 于 2020-4-3 22:24 发表
posted by wap, platform: Android
所以,不用对rdna2的光追和类dlss界王拳有太多期待,我可以这么理解吧?
欢迎光临 TGFC Lifestyle (http://club.tgfcer.com/) | Powered by Discuz! 6.0.0 |