» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 29 12
发新话题
打印

[音响] 借四张图说说音频采样与还原

https://www.bilibili.com/video/av6062953

这个视频没翻译的我贴过一次,523贴过一次,有翻译的我也贴过一次,现在至少四次了,借里面的图说一下音频处理过程:

第一步,对源波形采样,保证每个周期至少2个采样点:

说明:1.视频里用的波形是方波,选它做代表的原因是因为它最能说明傅立叶变换的特性,如果随便找两三个乐器叠加的波形让傅立叶变换去还原,一下子就输出了源波形,看不到输入和输出的差别,说明不了音频还原的特点。
2.认为“采样是不连续的,输出的波形是阶梯状”的人是不是从来就没有想过:如果输出的波形真是阶梯状的,那么方波应该是最容易还原的————这玩意一开始就是个阶梯?实际上现实里方波是无法完美还原的,不过人耳听不出差别,下面会讲解。

第二步,将采样点输入,用傅立叶变换计算得到函数y(t):

说明:1.无论在第一步里采样的是每周期2个点,还是每周期4个点,还是每周期8个点,输入之后用傅立叶变换得到的函数y(t)都是相同的,采样定理保证这个函数只有唯一解。
2.这个y(t)包含了无限多项,只有把这无限多项全部加起来,得到的才是标准的方波。
3.无限多个连续函数相加能得到不连续函数这个问题可以请问你们大学数学老师。
4.基本物理常识,简谐振动产生的都是正弦波(即y(t)的项),所以在现实里,用无限个不同频率的物体同时振动(频率也要一直提高到无限),出来的声音就是标准方波。
5.现实里做不到“无限个不同频率的物体同时振动”,所以标准的方波在现实里用任何乐器都演奏不出来,人也唱不出来,音乐里你也听不到这玩意。

第三步,去掉y(t)里包含人耳听不到的频率的项,得到函数y(t1),这里是剩下前10项,波形变得不再是标准方波:

说明:1.有限多个连续函数相加得到的仍然是连续函数,不懂的问大学数学老师,所以y(t1)的图像是连续不断的,不含任何“阶梯”。
2.不论源波形是什么样的,只要经过一、二、三步处理,得到的都是连续不断的唯一函数y(t1)。
3.y(t1)可以用演奏出来,只要让10个喇叭对应y(t1)的每一项来振动就行,所以这玩意现实里能听到。

第四步,输出y(t1)

说明:因为在第三步里去掉的是y(t)里包含人耳听不到的频率的项,所以你听到的y(t1)的声音,和y(t)的声音无任何区别,也就是10个喇叭,分别发出1khz、3khz、……、19khz的声音叠加,和无限个喇叭分别发出1khz、3khz、……、19khz、21khz、23khz、……来叠加,人耳听起来毫无差别————前提是能找到完美振动在这10个频率的喇叭,让它们同时振动,这是就是为什么现实里声音不能完美还原,也是hifi的理论起点。然而跟音频信号采样率提升半点关系都没有。

总结:当源波形包含人耳不能听到的频率的项时,还原的时候波形未必相同,但人耳听起来相同,并且永远不会出现阶梯状波形。
当源波形包含的频率人耳都能听到,还原的时候波形完全相同,但现实里的放大器、喇叭未必能100%演奏出这个完全相同的波形。

[ 本帖最后由 jjx01 于 2018-9-19 13:20 编辑 ]
附件: 您所在的用户组无法下载或查看附件


本帖最近评分记录
  • mushroom 激骚 +2 恭喜发财 2018-9-19 12:12

TOP

posted by wap, platform: iPhone
有线爱好者不是说有线肯定比蓝牙更好吗?



TOP

posted by wap, platform: Samsung
翔尼是不是说通过模型学习对截断的频谱图进行高频区域插值,试图恢复缺失的高频信息。虽然我不知道这可不可行。


TOP

posted by wap, platform: Android
力挺楼主

TOP

posted by wap, platform: iPad
这用来解释傅里叶变换是正确的,但用来解释音频采样还原我认为不合适
方波无论在采样前还是采样后都是频域连续的。就好比一条直线上有无穷个点,截一条线段上面还是有无穷个点
这文章用频域采样(注意和时域采样的区别)截取10个正弦函数来解释傅里叶变换没问题,但在实际音频处理中这么做还原出来是有失真的,因为会导致可听见频率的信息丢失

TOP

原来我有个失散多年的兄弟叫523,看来比我小9号

TOP

nice video

TOP

出差了两天原来还在讨论这东西
你这个理论来解释规则信号是没有问题的
但是实际的不管什么信号,都是随时随机在变化的,永远是很多不同信号的叠加,需要应对这个情况才需要提高DA的采样率
就你那贴非要说2点决定一个圆,你两点决定的圆是在限定平面限定他一定是圆的情况下,实际这东西可能是个鸡蛋,你两点怎么还原?
另外那贴里我也说了,sony写文案的家伙翻译的有问题,升频提高采样率提高的是信号的准确度,但是对没有的高频信号肯定是无能为力的

TOP

引用:
原帖由 甲级战犯他祖宗 于 2018-9-19 11:08 发表
posted by wap, platform: iPad
这用来解释傅里叶变换是正确的,但用来解释音频采样还原我认为不合适
方波无论在采样前还是采样后都是频域连续的。就好比一条直线上有无穷个点,截一条线段上面还是有无穷个点
这文章用频域采样(注意和时域采样的区别)截取10个正弦函数来解释傅里叶变换没问题,但在实际音频处理中这么做还原出来是有失真的,因为会导致可听见频率的信息丢失
首先,频域是类似这样的:

方波的频域视频里没出现
然后就没有然后了
附件: 您所在的用户组无法下载或查看附件

TOP

引用:
原帖由 jinye2001 于 2018-9-19 12:23 发表
出差了两天原来还在讨论这东西
你这个理论来解释规则信号是没有问题的
但是实际的不管什么信号,都是随时随机在变化的,永远是很多不同信号的叠加,需要应对这个情况才需要提高DA的采样率
就你那贴非要说2点决定一 ...
随时随机变化,这好像是噪音和音乐的区别

TOP

引用:
原帖由 flyingchaos 于 2018-9-19 10:48 发表
posted by wap, platform: Samsung
翔尼是不是说通过模型学习对截断的频谱图进行高频区域插值,试图恢复缺失的高频信息。虽然我不知道这可不可行。
可行,然而是测试智商
首先人唱不到那个高频,其次乐器发不出那个高频,最后人耳听不到那个高频,算出来给蝙蝠听差不多

[ 本帖最后由 jjx01 于 2018-9-19 13:33 编辑 ]

TOP

引用:
原帖由 jinye2001 于 2018-9-19 12:23 发表
出差了两天原来还在讨论这东西
你这个理论来解释规则信号是没有问题的
但是实际的不管什么信号,都是随时随机在变化的,永远是很多不同信号的叠加,需要应对这个情况才需要提高DA的采样率
就你那贴非要说2点决定一 ...
索尼那种玄学就算了吧

一般人家里的石英钟,无源晶振跑起来就那么几万hz

你往石英钟里面塞个100m有源恒温晶振,每年比上面的搓逼货准0.5秒,有意义么

TOP

posted by wap, platform: iPad
引用:
原帖由 @jjx01  于 2018-9-19 13:28 发表
首先,频域是类似这样的:
1024798
方波的频域视频里没出现
然后就没有然后了
这种频域离散的声音只能是人造的。任何自然界存在的声音频域永远是连续的。你该不会认为12khz的声音不存在吧

一般声音的频谱如图

TOP

posted by wap, platform: iPhone
引用:
原帖由 @jjx01  于 2018-9-19 13:30 发表
随时随机变化,这好像是噪音和音乐的区别
音乐本来就是随时随机变化的组合,难道你还能保证某人忽然来一敲一声锣正好是你采样的时刻?这个时刻过了就是过了,你再也采不到了,也就无法还原了
而且即便是完美的正弦信号,你采样不是整周期一样不能准确还原信号

TOP

还是模拟直接录最高?

TOP

 29 12
发新话题
     
官方公众号及微博