» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 18 12
发新话题
打印

[电脑] N卡必须RTX才支持光追和DLSS,是出于什么原因?

呵呵,如果AMD的方案能打,DLSS马上只要求CUDA就可以;所有老显卡到GTX 900 series全部可用。

CUDA core和Tensor core能干的事情都是一样的,矩阵乘以矩阵。

写CUDA的C++底层就知道CUDA本质加速的是向量(比如一列像素的值)乘以向量;所以算矩阵乘以矩阵的时候有个overhead就是要把矩阵拉成一长条;就好比一个工人把高120宽80的砖墙一块一块放平成一个120*80长,高1的砖堆,他要来回放砖9600次。

Tensor core的计算单位是4x4的矩阵,矩阵或者高维的张量被分成小块做乘法,效率更高(因为超采样就是一个矩阵乘法);用刚才的例子来说,这个工人不用把这个砖墙拉平了,他每次拿的是4x4的小砖墙,现在来回只要放砖(120/4)*(80/4)= 600次。

当然这是全部处理中很小的一部分,tensor core对有很多0的矩阵效率更高。

NV在放游戏展示的时候根本不会告诉你,两个core其实是干一样的活。


TOP

posted by wap, platform: iPhone
我理解是和挖矿逻辑一样,需要大量的浮点运算,

现在的机器学习神经网络原理上就是大量筛除算法,把每次得到结果累计到权重上,最后得到一个权重最高的值



TOP

引用:
原帖由 Alloyo 于 2021-6-25 01:14 发表
posted by wap, platform: iPhone
我理解是和挖矿逻辑一样,需要大量的浮点运算,

现在的机器学习神经网络原理上就是大量筛除算法,把每次得到结果累计到权重上,最后得到一个权重最高的值
权重矩阵不需要用户算,NV算好之后给用户。


TOP

 18 12
发新话题
     
官方公众号及微博