打印

ns2的dlss应该很垃圾吧

yfl2

五道杠

帖子: 57072
精华: 0
积分: 28018
激骚: 10429 度
爱车
主机
相机
手机
注册时间: 2013-3-17

发短消息
加为好友
当前在线

16^# 大中小发表于 2025-1-21 10:55 只看该作者

说的是超分，sw2 大概率用dlss的简化模型，不然耗时太长

TOP

kyoyky

hellokitty

混世魔头

帖子: 3316
精华: 0
积分: 17657
激骚: 1038 度
爱车
主机
相机
手机
注册时间: 2009-8-10

PS区索饭认证☆☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前在线

17^# 大中小发表于 2025-1-21 12:43 只看该作者

posted by wap, platform: Android
不可能垃圾，ns就是瓶dl ss才敢把硬件搞成八纳米。

TOP

Nemo_theCaptain

元始天尊

帖子: 45209
精华: 16
积分: 62487
激骚: 6963 度
爱车
主机
相机
手机
注册时间: 2013-7-7

发短消息
加为好友
当前在线

18^# 大中小发表于 2025-1-21 12:49 只看该作者

保底是DLSS2，实际上我认为也就是DLSS2，再垃圾能有多垃圾？2020年的时候怎么不说DLSS2垃圾？

DLSS2拉伸到1080p确实是不如原生，但是没有这个的话就是马赛克暴力拉伸

本来掌机谈1080p就不切实际，就PS5还一堆游戏保不住1080p 60呢

TOP

爱猫咪的薛定谔

魔王撒旦

帖子: 6431
精华: 0
积分: 16234
激骚: 29 度
爱车
主机
相机
手机
注册时间: 2016-4-16

发短消息
加为好友
当前离线

19^# 大中小发表于 2025-1-21 12:57 只看该作者

posted by wap, platform: Android

引用:

原帖由 @Nemo_theCaptain 于 2025-1-21 04:49 发表
保底是DLSS2，实际上我认为也就是DLSS2，再垃圾能有多垃圾？2020年的时候怎么不说DLSS2垃圾？

DLSS2拉伸到1080p确实是不如原生，但是没有这个的话就是马赛克暴力拉伸

本来掌机谈1080p就不切实际，就PS5还一堆游戏保不住1080p 60呢

大概率是简化版，因为算力不足

TOP

egawa

魔头

帖子: 1111
精华: 0
积分: 67
激骚: 0 度
爱车
主机
相机
手机
注册时间: 2019-5-7

发短消息
加为好友
当前在线

20^# 大中小发表于 2025-1-21 13:06 只看该作者

引用:

原帖由 爱猫咪的薛定谔 于 2025-1-21 12:57 发表
posted by wap, platform: Android
大概率是简化版，因为算力不足

算力不会不足，像nv家用显卡的tensor算力都是大大富裕的，哪儿看到过，40系dlss2+帧生成一起开，占用的tensor算力最多也就占百分之十几。

否则低端的50，60显卡，和80，90显卡tensor算力差距那么大，岂不是dlss效果有很大差别，没听说过这事吧。

TOP

爱猫咪的薛定谔

魔王撒旦

帖子: 6431
精华: 0
积分: 16234
激骚: 29 度
爱车
主机
相机
手机
注册时间: 2016-4-16

发短消息
加为好友
当前离线

21^# 大中小发表于 2025-1-21 13:13 只看该作者

posted by wap, platform: Android

引用:

原帖由 @egawa 于 2025-1-21 05:06 发表
算力不会不足，像nv家用显卡的tensor算力都是大大富裕的，哪儿看到过，40系dlss2+帧生成一起开，占用的tensor算力最多也就占百分之十几。

否则低端的50，60显卡，和80，90显卡tensor算力差距那么大，岂不是dlss效果有很大差别，没听说过这事吧。

是占用时间不同，低端卡占比就高了

TOP

qc0511

混世魔头

帖子: 2911
精华: 0
积分: 12723
激骚: 2 度
爱车
主机
相机
手机
注册时间: 2016-5-22

发短消息
加为好友
当前离线

22^# 大中小发表于 2025-1-21 13:14 只看该作者

posted by wap, platform: iPhone
dlss4都不肯下放到40 ns2指定没戏

TOP

egawa

魔头

帖子: 1111
精华: 0
积分: 67
激骚: 0 度
爱车
主机
相机
手机
注册时间: 2019-5-7

发短消息
加为好友
当前在线

23^# 大中小发表于 2025-1-21 13:21 只看该作者

引用:

原帖由 爱猫咪的薛定谔 于 2025-1-21 13:13 发表
posted by wap, platform: Android
是占用时间不同，低端卡占比就高了

咋占用时间不同啊，4090dlss3x2，帧生成60帧变120帧，4060就只能x1.5，60帧变90帧了，你听说过吗？

分辨率超分的dlss2也是一样的，要说基础分辨率和帧数的区别，那也是cuda核心规模的区别。

本身给这么大算力主要也是训练的时候，而游戏里用到的dlss，都是在推理，本身算力需求就比训练小很多

TOP

爱猫咪的薛定谔

魔王撒旦

帖子: 6431
精华: 0
积分: 16234
激骚: 29 度
爱车
主机
相机
手机
注册时间: 2016-4-16

发短消息
加为好友
当前离线

24^# 大中小发表于 2025-1-21 13:24 只看该作者

posted by wap, platform: Android

引用:

原帖由 @egawa 于 2025-1-21 05:21 发表
咋占用时间不同啊，4090dlss3x2，帧生成60帧变120帧，4060就只能x1.5，60帧变90帧了，你听说过吗？

分辨率超分的dlss2也是一样的，要说基础分辨率和帧数的区别，那也是cuda核心规模的区别。

本身给这么大算力主要也是训练的时候，而游戏里用到的dlss，都是在推理，本身算力需求就比训练小很多

是超分时候额外增加的处理时间，低端卡需要更多时间做dlss

TOP

egawa

魔头

帖子: 1111
精华: 0
积分: 67
激骚: 0 度
爱车
主机
相机
手机
注册时间: 2019-5-7

发短消息
加为好友
当前在线

25^# 大中小发表于 2025-1-21 13:33 只看该作者

引用:

原帖由 爱猫咪的薛定谔 于 2025-1-21 13:24 发表
posted by wap, platform: Android
是超分时候额外增加的处理时间，低端卡需要更多时间做dlss

超分时候额外增加处理时间,就会导致帧数不同了.

比如都是原生2K60帧, dlss变4K, 4090用的时间少,还是60帧, 4060每一帧超分用的时间多可能就只有50帧了. 然后再来个帧生成,4090用的时间少,可以x2,120帧, 4060用的时间又多,只能x1.5, 50帧变成75帧.

也就是同样原生2K60帧的游戏, 4090 dlss完了变4k120帧,4060变4K 75帧了, 哪儿有这事?

老黄给的那么多tensor算力主要差别是训练的时候, 游戏里的dlss是在推理, 本身算力需求就小很多.

[ 本帖最后由 egawa 于 2025-1-21 13:34 编辑 ]

TOP

爱猫咪的薛定谔

魔王撒旦

帖子: 6431
精华: 0
积分: 16234
激骚: 29 度
爱车
主机
相机
手机
注册时间: 2016-4-16

发短消息
加为好友
当前离线

26^# 大中小发表于 2025-1-21 13:36 只看该作者

posted by wap, platform: Android

引用:

原帖由 @egawa 于 2025-1-21 05:33 发表
超分时候额外增加处理时间,就会导致帧数不同了.

比如都是原生2K60帧, dlss变4K, 4090用的时间少,还是60帧, 4060每一帧超分用的时间多可能就只有50帧了. 然后再来个帧生成,4090用的时间少,可以x2,120帧, 4060用的时间又多,只能x1.5, 50帧变成75帧.

也就是同样原生2K60帧的游戏, 4090 dlss完了变4k120帧,4060变4K 75帧了, 哪儿有这事?

老黄给的那么多tensor算力主要差别是训练的时候, 游戏里的dlss是在推理, 本身算力需求就小很多.

原生60帧如果不是限帧，用了超分就没法60了，因为dlss的原理是等原生帧渲染结束再开始超分，是串行的

TOP

egawa

魔头

帖子: 1111
精华: 0
积分: 67
激骚: 0 度
爱车
主机
相机
手机
注册时间: 2019-5-7

发短消息
加为好友
当前在线

27^# 大中小发表于 2025-1-21 13:41 只看该作者

引用:

原帖由 爱猫咪的薛定谔 于 2025-1-21 13:36 发表
posted by wap, platform: Android
原生60帧如果不是限帧，用了超分就没法60了，因为dlss的原理是等原生帧渲染结束再开始超分，是串行的

是没有,但是同样原生分辨率和帧数，dlss到同样的目标分辨率，或者再加个帧生成，4090和4060的dlss干这事差别很小，可以说基本没差别，算力瓶劲就不在这儿。

而原生分辨率帧数4090和4060的巨大差别，那就是cuda核心规模导致的算力差别了，如果再加上光追，那还有光追核心规模的区别。

TOP

爱猫咪的薛定谔

魔王撒旦

帖子: 6431
精华: 0
积分: 16234
激骚: 29 度
爱车
主机
相机
手机
注册时间: 2016-4-16

发短消息
加为好友
当前离线

28^# 大中小发表于 2025-1-21 13:44 只看该作者

posted by wap, platform: Android

引用:

原帖由 @egawa 于 2025-1-21 05:41 发表
是没有,但是同样原生分辨率和帧数，dlss到同样的目标分辨率，或者再加个帧生成，4090和4060的dlss干这事差别很小，可以说基本没差别，算力瓶劲就不在这儿。

而原生分辨率帧数4090和4060的巨大差别，那就是cuda核心规模导致的算力差别了，如果再加上光追，那还有光追核心规模的区别。

我不知道你的数据来源，但sw2的tenson性能距离4060差太多
另外可以侧面参考amd和ps5pro.如果超分性能需求低，fsr4也就不需要捆绑专用单元了，ps5pro同理

TOP

link520

混世魔头

帖子: 4451
精华: 0
积分: 3944
激骚: 48 度
爱车
主机
相机
手机
注册时间: 2021-8-17

发短消息
加为好友
当前离线

29^# 大中小发表于 2025-1-21 13:57 只看该作者

posted by wap, platform: Android
任天堂申请了一堆相关专利，下一代就靠dlss拉低跟家用机的距离，怎么可能会特别拉，我记得任天堂的专利连480p都能给你拉

TOP

hourousha

魔王撒旦

帖子: 5309
精华: 0
积分: 27986
激骚: 436 度
爱车
主机
相机
手机
注册时间: 2004-1-7

TGFC 2015新年勋章☆☆☆☆

发短消息
加为好友
当前离线

30^# 大中小发表于 2025-1-21 14:02 只看该作者

引用:

原帖由 爱猫咪的薛定谔 于 2025-1-21 13:36 发表
posted by wap, platform: Android
原生60帧如果不是限帧，用了超分就没法60了，因为dlss的原理是等原生帧渲染结束再开始超分，是串行的

是串行不假，但是可以流水线化的，简单说就是上一帧的DLSS可以和当前帧的常规渲染并行，因为他们用的是不同单元。当然这会增加1帧的输入延迟。

TOP