» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

ns2的dlss应该很垃圾吧

说的是超分,sw2 大概率用dlss的简化模型,不然耗时太长


TOP

posted by wap, platform: Android
不可能垃圾,ns就是瓶dl ss才敢把硬件搞成八纳米。



TOP

保底是DLSS2,实际上我认为也就是DLSS2,再垃圾能有多垃圾?2020年的时候怎么不说DLSS2垃圾?

DLSS2拉伸到1080p确实是不如原生,但是没有这个的话就是马赛克暴力拉伸

本来掌机谈1080p就不切实际,就PS5还一堆游戏保不住1080p 60呢


TOP

posted by wap, platform: Android
引用:
原帖由 @Nemo_theCaptain  于 2025-1-21 04:49 发表
保底是DLSS2,实际上我认为也就是DLSS2,再垃圾能有多垃圾?2020年的时候怎么不说DLSS2垃圾?

DLSS2拉伸到1080p确实是不如原生,但是没有这个的话就是马赛克暴力拉伸

本来掌机谈1080p就不切实际,就PS5还一堆游戏保不住1080p 60呢
大概率是简化版,因为算力不足

TOP

引用:
原帖由 爱猫咪的薛定谔 于 2025-1-21 12:57 发表
posted by wap, platform: Android
大概率是简化版,因为算力不足
算力不会不足,像nv家用显卡的tensor算力都是大大富裕的,哪儿看到过,40系dlss2+帧生成一起开,占用的tensor算力最多也就占百分之十几。

否则低端的50,60显卡,和80,90显卡tensor算力差距那么大,岂不是dlss效果有很大差别,没听说过这事吧。

TOP

posted by wap, platform: Android
引用:
原帖由 @egawa  于 2025-1-21 05:06 发表
算力不会不足,像nv家用显卡的tensor算力都是大大富裕的,哪儿看到过,40系dlss2+帧生成一起开,占用的tensor算力最多也就占百分之十几。

否则低端的50,60显卡,和80,90显卡tensor算力差距那么大,岂不是dlss效果有很大差别,没听说过这事吧。
是占用时间不同,低端卡占比就高了

TOP

posted by wap, platform: iPhone
dlss4都不肯下放到40 ns2指定没戏

TOP

引用:
原帖由 爱猫咪的薛定谔 于 2025-1-21 13:13 发表
posted by wap, platform: Android
是占用时间不同,低端卡占比就高了
咋占用时间不同啊,4090dlss3x2,帧生成60帧变120帧,4060就只能x1.5,60帧变90帧了,你听说过吗?

分辨率超分的dlss2也是一样的,要说基础分辨率和帧数的区别,那也是cuda核心规模的区别。

本身给这么大算力主要也是训练的时候,而游戏里用到的dlss,都是在推理,本身算力需求就比训练小很多

TOP

posted by wap, platform: Android
引用:
原帖由 @egawa  于 2025-1-21 05:21 发表
咋占用时间不同啊,4090dlss3x2,帧生成60帧变120帧,4060就只能x1.5,60帧变90帧了,你听说过吗?

分辨率超分的dlss2也是一样的,要说基础分辨率和帧数的区别,那也是cuda核心规模的区别。

本身给这么大算力主要也是训练的时候,而游戏里用到的dlss,都是在推理,本身算力需求就比训练小很多
是超分时候额外增加的处理时间,低端卡需要更多时间做dlss

TOP

引用:
原帖由 爱猫咪的薛定谔 于 2025-1-21 13:24 发表
posted by wap, platform: Android
是超分时候额外增加的处理时间,低端卡需要更多时间做dlss
超分时候额外增加处理时间,就会导致帧数不同了.

比如都是原生2K60帧, dlss变4K, 4090用的时间少,还是60帧, 4060每一帧超分用的时间多可能就只有50帧了. 然后再来个帧生成,4090用的时间少,可以x2,120帧, 4060用的时间又多,只能x1.5, 50帧变成75帧.

也就是同样原生2K60帧的游戏, 4090 dlss完了变4k120帧,4060变4K 75帧了, 哪儿有这事?

老黄给的那么多tensor算力主要差别是训练的时候, 游戏里的dlss是在推理, 本身算力需求就小很多.

[ 本帖最后由 egawa 于 2025-1-21 13:34 编辑 ]

TOP

posted by wap, platform: Android
引用:
原帖由 @egawa  于 2025-1-21 05:33 发表
超分时候额外增加处理时间,就会导致帧数不同了.

比如都是原生2K60帧, dlss变4K, 4090用的时间少,还是60帧, 4060每一帧超分用的时间多可能就只有50帧了. 然后再来个帧生成,4090用的时间少,可以x2,120帧, 4060用的时间又多,只能x1.5, 50帧变成75帧.

也就是同样原生2K60帧的游戏, 4090 dlss完了变4k120帧,4060变4K 75帧了, 哪儿有这事?

老黄给的那么多tensor算力主要差别是训练的时候, 游戏里的dlss是在推理, 本身算力需求就小很多.
原生60帧如果不是限帧,用了超分就没法60了,因为dlss的原理是等原生帧渲染结束再开始超分,是串行的

TOP

引用:
原帖由 爱猫咪的薛定谔 于 2025-1-21 13:36 发表
posted by wap, platform: Android
原生60帧如果不是限帧,用了超分就没法60了,因为dlss的原理是等原生帧渲染结束再开始超分,是串行的
是没有,但是同样原生分辨率和帧数,dlss到同样的目标分辨率,或者再加个帧生成,4090和4060的dlss干这事差别很小,可以说基本没差别,算力瓶劲就不在这儿。

而原生分辨率帧数4090和4060的巨大差别,那就是cuda核心规模导致的算力差别了,如果再加上光追,那还有光追核心规模的区别。

TOP

posted by wap, platform: Android
引用:
原帖由 @egawa  于 2025-1-21 05:41 发表
是没有,但是同样原生分辨率和帧数,dlss到同样的目标分辨率,或者再加个帧生成,4090和4060的dlss干这事差别很小,可以说基本没差别,算力瓶劲就不在这儿。

而原生分辨率帧数4090和4060的巨大差别,那就是cuda核心规模导致的算力差别了,如果再加上光追,那还有光追核心规模的区别。
我不知道你的数据来源,但sw2的tenson性能距离4060差太多
另外可以侧面参考amd和ps5pro.如果超分性能需求低,fsr4也就不需要捆绑专用单元了,ps5pro同理

TOP

posted by wap, platform: Android
任天堂申请了一堆相关专利,下一代就靠dlss拉低跟家用机的距离,怎么可能会特别拉,我记得任天堂的专利连480p都能给你拉

TOP

引用:
原帖由 爱猫咪的薛定谔 于 2025-1-21 13:36 发表
posted by wap, platform: Android
原生60帧如果不是限帧,用了超分就没法60了,因为dlss的原理是等原生帧渲染结束再开始超分,是串行的
是串行不假,但是可以流水线化的,简单说就是上一帧的DLSS可以和当前帧的常规渲染并行,因为他们用的是不同单元。当然这会增加1帧的输入延迟。

TOP

发新话题
     
官方公众号及微博