打印

[音响] 优化44.1khz内容至176.4khz

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

1^# 大中小发表于 2018-9-17 15:33 显示全部帖子

posted by wap, platform: iPad
这帖喷了

其实吧，这个世界有两种人：第一种人懂傅里叶变换，第二种人不懂

第一种人是不会相信这种玄学的，只有第二种人会。诚然第一种人数量不太多，绝大部分都是第二种人，所以玄学盛行

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

2^# 大中小发表于 2018-9-18 09:49 显示全部帖子

posted by wap, platform: iPad
升频喷了把帕瓦罗蒂的highC升到highE吗？

44.1khz取样频率的直接结果是把22khz以上的信息给生生切掉了。既然切掉了，就算用一百亿赫兹再采样也是白搭啊

还是那句话，懂傅里叶变换的人和不懂的人区别就在这了

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

3^# 大中小发表于 2018-9-18 09:55 显示全部帖子

posted by wap, platform: iPad
我不懂行，我只知道玄学很有市场，有空嘲笑一下很补充优越感啊

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

4^# 大中小发表于 2018-9-18 11:30 显示全部帖子

posted by wap, platform: iPad
我觉得这和插帧完全不是一回事。插帧是发生在时域的，而取样影响的是频域
插帧是两张画面中间真的无中生有给插了第三张画面，这个4倍频再采样出来的结果是不会无中生有的。别说4倍，就算是四百倍再采样，22khz以上的频域信息没有不能变成有

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

5^# 大中小发表于 2018-9-18 11:39 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @doomking 于 2018-9-18 11:33 发表
傅立叶变换后还是要一个个点取样转模拟输出到二级口的，提高采样率等于提高了取样率，声音会更平滑，这点索尼倒是没说错的。

按我的理解整个过程是这样的：
44khz采样获得的数字信号 -> 数模转换 -> 模拟信号 -> 176khz再采样获得数字信号 -> 再数模转换 -> 模拟音频

如果以上理解是对的，那我只能说：1）176khz再采样多出来的信息只能来自于第一次数模转换带来的杂质 2）两次数模转换纯属脱裤子放屁倒也罢了玄学爱好者能忍？

本帖最后由甲级战犯他祖宗于 2018-9-18 11:44 通过手机版编辑

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

6^# 大中小发表于 2018-9-18 11:49 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @doomking 于 2018-9-18 11:44 发表
没有第一次数模转换的，原始数字音频滤波完直接用高采样率采，信息不会变化(可能还会有多的杂讯)，时域信号变得更平滑。

这个真喷了。以我羸弱的信号处理知识，采样（sampling）永远是对模拟信号（时域连续）而言的。从来没听说过可以对数字信号（时域离散）进行采样。骚尼真是突破我的认知

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

7^# 大中小发表于 2018-9-18 12:06 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @doomking 于 2018-9-18 11:58 发表
什么鬼，升频的采样率就是fft里的fs啊，又不是录音设备记录数据那个频率。

抱歉，我不知道如何对数字信号采样，更不知道如何对数字信号fft。大法最高不断突破上限屌炸天

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

8^# 大中小发表于 2018-9-18 17:03 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-18 13:33 发表
okok，大概明白了。

你说的是把数列转换为正弦波的算式，然后在这个算式上重新采样。一切都只是计算，没有经过实际的DAC。

这。。。数列转正弦波算式是什么情况？DAC里面有这个处理吗？
转正弦算式只会发生在黑板上，DAC又不需要
再说了，频域离散的信号转转正弦算式倒也罢了，声音信号是频域连续的，即便是只转有限频率的声音信号算式也会有无穷长度。。。

然后对算式采样

对数字信号采样还不够这对算式也能采样

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

9^# 大中小发表于 2018-9-19 10:15 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-18 19:23 发表
这不是在进入DAC之前么，至于重采样，不用fft转成正弦波怎么采。数字信号都是离散的还有什么好采的。

咦抱歉好像把你和说数字信号采样的那人弄混了

然后我再读了几次你们的发言发现好像明白了，你们是不是都搞错了一个基本的点：傅里叶变换是信号分析工具，不是数模转换工具。换句话说，DAC，至少音频DAC，压根儿不涉及傅里叶变换

难怪一开始没明白你们为啥突然说fft

原因也很明显：音频信号肯定是频域连续的，即便是经过采样以后的信号也是频域连续。这意味着无论是否限制频段，音频信号展开成傅里叶级数都将是无限长度。就好比二维坐标系里用一系列点坐标确定一个线段也会是无限长度
再说了，模数转换说白了就是采样然后拿把尺子量量再按分辨率四舍五入到数字就完事了，数模反过来。根本犯不着算傅里叶级数那么麻烦

然后再说说这个插帧：用视频信号插帧来理解索尼这个牛皮是不合适的。原因同样很简单：视频信号时域离散，而音频信号时域连续。换句话说，一秒钟视频有24帧，可以通过算法把它提高到48甚至更高。音频信号没这回事，一秒钟内的音频是连续不断的，没法给你插东西
还有分辨率插值也是同样：数字视频的分辨率是空域离散的，两个像素之间可以插东西。音频更是没有空域就更不是一回事了

说这么多，其实还是那句话：能理解傅里叶变换的自然能明白，不理解的可能就上索尼的当了

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

10^# 大中小发表于 2018-9-19 11:41 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-19 11:30 发表
DAC最终输出的电平信号也不需要通过傅立叶变换展开。
我想搞懂的是怎么对44khz的数据重采样到176khz。为了保证这176khz的数据是对的，不是要把f(x)的函数式重新写出来才能再采样么。

但实际上176khz的数据是否严密没有意义。DAC的输出电平如果是2点之间线性变化，那么输出的波形都是尖的（听感不好？）。
重采样的176khz的数据是猜的（AI），但效果比纯线性变化要好，使DAC输出的波形比44khz更接近于原始的f(x)。
从这个理论上说，在线性输出的dac上（或者类似的DAC），给44khz数据做插值有可能会有比原始数据直接进dac要好(输出电平比较)，理论上。

但如果是这样的话，理论上176khz采样的原始数据会有最好的效果。对于同一个DAC而言，输出电平一定是原始采样率越高就越好。
这个应该是能够从输出上直接比较出来的，也就不会有高采样率是否有意义的问题了。

我终于明白了
对于认为高采样率有效的人来说，插值就是有效的，DAC能输出可分辨的更好的电平信号。
对于认为高采样率无效的人来说，插值就是无效的，DAC不能输出可分辨的更好的电平信号。
信则有，不信则无。
这才是玄学精髓。

如果你想搞懂一个根本不符合科学原理的事情，就说明你不明白这个科学原理
把f(x)写出来喷了。我上面说过，f(x)写出来只会发生在黑板上，而且只能是近似的。真正的f(x)有无穷长度，取样之前需要无穷大的存储空间哪儿找去啊

再说了，假设真的有火星科技可以把f(x)完整写出来，对f(x)的采样就是对频域的采样。那么问题来了：除非为了省事写黑板，对频域的采样有什么现实意义么？抱歉，我想不出来

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

11^# 大中小发表于 2018-9-19 12:56 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-19 12:15 发表
f(x)没必要全部展开，只需要展开到20Khz就可以了。

请问一段长度为1的线段里面有多少个点？
同理，请问展开到20khz的f(x)将有多少项？

答案都是无穷多。f(x)里的每一项都仅代表一个固定频率的强度，而频率本身是连续可以无穷划分的

哦然后你想在无穷多项里面进行取样。那么请问取样规则是什么？每赫兹1次？那100.5hz的信息不要啦？每赫兹100次？那100.0001hz的信息不要啦？类推。。。

我再从侧面证明一下为啥你的理解很搞笑：采样单位hz是时域单位（次/秒）。而f(x)描述的是频域。时域单位在频域中是无效的，你需要一个新的单位：次/赫兹=次/(次/秒)=秒

取样单位是秒啊

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

12^# 大中小发表于 2018-9-20 09:55 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-19 17:40 发表
我们需要数学上的严密正确来解析么。
目的是重采样，采样结果的精度由bit depth控制，在结果精度能反应的差距中保持结果一致就可以对吧。

如果人类不能区分100hz和100.5hz之间的区别。x为啥需要有无限项。
比如说我们的目标是24bit/176khz。一定能够有一个极限最大精度，任何小于这个精度的展开都只能获得相同的176khz采样结果。

如果我们的目标是在数学上用方程严密得重现一个自然音源，那我承认这是不可能的，黑板太小。
但是，到一定微观程度下，物理世界中所有的量都是离散的，没有连续这件事情。波只是声音在宏观上的一种描述而已，粒子的移动并不是连续的。
...这个说说而已...

顺便
fx不是一个值么？波形图横轴是时间，纵轴是振幅，16bit的话32K~32K?

>如果人类不能区分100hz和100.5hz之间的区别。x为啥需要有无限项。
这个笑话实在太大所以不好笑了。。。
举个例子，音乐里的中央C对应频率是261.625565 hertz（你可以试试直接google关键字"middle c"）。这个数字是精确的么？不是。这只是一个小数点后6位精确度的频率罢了，完整精度将是一个无理数。那么，你觉得人耳能不能区分100hz和100.5hz呢？

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

13^# 大中小发表于 2018-9-20 09:59 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-19 17:40 发表
我们需要数学上的严密正确来解析么。
目的是重采样，采样结果的精度由bit depth控制，在结果精度能反应的差距中保持结果一致就可以对吧。

如果人类不能区分100hz和100.5hz之间的区别。x为啥需要有无限项。
比如说我们的目标是24bit/176khz。一定能够有一个极限最大精度，任何小于这个精度的展开都只能获得相同的176khz采样结果。

如果我们的目标是在数学上用方程严密得重现一个自然音源，那我承认这是不可能的，黑板太小。
但是，到一定微观程度下，物理世界中所有的量都是离散的，没有连续这件事情。波只是声音在宏观上的一种描述而已，粒子的移动并不是连续的。
...这个说说而已...

顺便
fx不是一个值么？波形图横轴是时间，纵轴是振幅，16bit的话32K~32K?

> fx不是一个值么？波形图横轴是时间，纵轴是振幅，16bit的话-32K~32K?
呃，既然你有兴趣那我试试再讲解一下，请准备好一点点平面几何知识

傅里叶变换里面的等号左边的f(x)代表了整个信号（无论是声音还是什么别的信号）的完整波形——关键词“完整”。右边展开式代表了组成该完整波形的所有频率强度表达式——关键词“所有”
然后要注意傅里叶变换和傅里叶级数的区别和联系。对完整信号的傅里叶变换应该分为两部分：第一部分是分离所有基础频率以及其倍频的组合，第二部分是对每一个组合进行傅里叶级数展开活动所有倍频处的强度信息
上面这两段如果难理解，可以类比成平面几何：对一个矩形的分解可以分为两步：第一步把矩形纵向劈开成所有组成该矩形的线段，每条线段长度等于纵向长度，第二步横向分解组成每一条线段的所有的点
可以看出，矩形由无穷条线段组成，每条线段由无穷个点组成。同样道理也可以用来理解傅里叶变换
这里当然也会有例外。比如横向长度无穷小的矩形就只能劈成一条线段，类比单一频率的信号也只能分解成一组傅里叶级数。纵向长度无穷小的线段只能分解成一个点，类比单一正弦波形的傅里叶级数只有一项——但是这样的例外只存在于理论，不存在于自然界同样类比，自然界不存在平面几何理论中的理想线段和点

如果能理解上面那些，恭喜你，已经理解一半了。继续往下讨论频域和时域。请准备好一点点微积分知识
如果把f(x)看作一枚硬币，频域时域就可以看作硬币的两面，在数学上互为倒数关系（极其重要）。如果能理解上面那一半，就可以发现傅里叶变换后的多项式实际上是对f(x)在频域上的积分，多项式的每一项可以看作f(x)在频域上的微分
所以，对任意信号的还原，理论上可以通过对频域从0到正无穷的无穷积分实现。理论上可行，实际上做不到，只能通过有限积分逼近大致还原。那么到底有限到哪里才能充分还原呢？最后研究出来香农取样定理，具体就不展开了，但这里有个重点：对时域的取样等同于对频域的积分，无限取样意味着无限积分（做不到），有限取样意味着有限积分（逼近）

然后回到你的理解：索尼这个玩意是对变换后f(x)右边的取样。上面说了，f(x)右边代表了频域，对频域取样意味着什么？还记得上面说的倒数关系吗？对频域的取样意味着对时域的积分
且不谈对频域取样的意义（上面解释过了没有意义），乖乖隆里咚对时域的无限积分在理论上都不可能，更别提用有限积分接近了。为啥？时域范围负无穷到正无穷，0=now。如果能积分，说明人类已经可以预知未来。所以不可能

因此，对频域取样的操作既缺乏任何理论基础，又缺乏实际意义，可以看作纯粹谬误，没有任何疑问

以上是我对傅立叶变换最高级别的讲解（高级别不等于高水平），再往下就要涉及具体数学运算超出我的能力范围了，祝你能看懂

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

14^# 大中小发表于 2018-9-20 10:13 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @jjx01 于 2018-9-19 23:37 发表
而且在2020khz里无限种连续频率
不知如何证明？
如果出现无穷多项，内存都不够存储这个f(t)函数，直接爆炸
查了一下：周期信号可以展开成傅立叶级数，非周期信号则是傅立叶变换
所以不会出现连续的频率项，只会出现整数倍频率项
非周期信号那个是连续积分才会有连续频率吧

抱歉，我既不知道你想证明什么观点，也不知道我需要证明什么观点

证明"声音频域连续"吗？在我看来这应该是常识，就好比“一条线上有无数点”一样不需要证明，况且我也确实不知道该如何证明。。。

频域离散的声音存不存在？只存在于理论，实际上不存在，只能无限接近。这也应该是常识。就好比“长度为L的线段存不存在”？同样只存在于理论，实际上不存在，只能无限接近

另外帖里那俩频谱图在我看来充分印证了“声音频域连续”这个观点。如果你能得出相反观点，说明你对“连续”和“离散”这两个基本概念存在理解偏差。“万物是连续的，测量是离散的”应该是每个人都必须具有的基本世界观。我记得第一次有这个概念是初中开始学习物理的时候。老师并不会说这句话，只能自己体会。如果你到现在还没获得这个观点，那么我表示很遗憾

最后举个例子。钢琴每个按键的音准都是有固定频率的，所以在频谱上是离散的吗？自己看

TOP

甲级战犯他祖宗

混世魔头

帖子: 3709
精华: 0
积分: 5513
激骚: 38 度
爱车: 犬子情何以堪！！
主机: 犬子情何以堪！！
相机: 犬子情何以堪！！
手机: 犬子情何以堪！！
注册时间: 2012-9-28

发短消息
加为好友
当前离线

15^# 大中小发表于 2018-9-20 12:46 显示全部帖子

posted by wap, platform: iPad

引用:

原帖由 @mushroom 于 2018-9-20 12:15 发表
我不知道人耳能不能分辨100 和 100.5
我知道我不能在c和c#之间区分出100级音阶来
我知道人类一定有极限，所以6位小数对于中央C来说纯属多余。你一定分不出261.625565和261.625566的区别，我可以赌钱。

这实在是有点无力吐槽了
人耳能不能分辨？这问题完全无关紧要。我们假设人耳不能分辨100.5hz和100hz吧，标准CD标准已经足够包含20~20khz以内所有的频谱信息了，记住是所有，100.5在里面呆得好好的，你干嘛想把人家去掉呢？图啥啊想不通

类比一下，就好像你买个4k显示器，说反正3米外分辨不出来左起第100个和101个像素，所以一定要把第101个像素戳灭掉——图啥啊啊啊？让人家在那里好好呆着发挥作用不行吗

TOP