Board logo

标题: [音响] 优化44.1khz内容至176.4khz [打印本页]

作者: jjx01    时间: 2018-9-14 19:45     标题: 优化44.1khz内容至176.4khz

https://mp.weixin.qq.com/s/VQYn-Qy4JggDg8wIJwFKyg
[attach]1023999[/attach]

顺便劣化智商?
作者: jinye2001    时间: 2018-9-14 19:49

posted by wap, platform: iPhone
相当于图片的智能去马赛克呗
有什么难理解的?
作者: jjx01    时间: 2018-9-14 20:08

引用:
原帖由 jinye2001 于 2018-9-14 19:49 发表
posted by wap, platform: iPhone
相当于图片的智能去马赛克呗
有什么难理解的?
图片有马赛克,因为现实里的景象没有马赛克,有多余的信息可以通过”猜测“来还原
现实音乐里面本来就没有那些高频,去哪里还原去?
作者: qwased    时间: 2018-9-14 20:38

别问,问就是你穷逼不会玩
作者: jFz    时间: 2018-9-14 20:49

ZX300还没出升级款,倒先出了个降级款23333
作者: joachim    时间: 2018-9-14 20:52

这三个型号的具体区别是什么?
作者: jun4rui    时间: 2018-9-14 21:04

posted by wap, platform: GOOGLE Nexus 4
引用:
原帖由 @jjx01  于 2018-9-14 00:08 发表
图片有马赛克,因为现实里的景象没有马赛克,有多余的信息可以通过”猜测“来还原
现实音乐里面本来就没有那些高频,去哪里还原去?
很简单,就拿原始音轨无损文件和该文件压缩后的MP3比,这样就有无数的样本了
作者: jjx01    时间: 2018-9-14 21:05

引用:
原帖由 joachim 于 2018-9-14 20:52 发表
这三个型号的具体区别是什么?
NW-A55不带降噪耳机,内存16G
NW-A55HN带耳机,内存16G
NW-A56HN内存32G
作者: jjx01    时间: 2018-9-14 21:06

引用:
原帖由 jun4rui 于 2018-9-14 21:04 发表
posted by wap, platform: GOOGLE Nexus 4
很简单,就拿原始音轨无损文件和该文件压缩后的MP3比,这样就有无数的样本了
原始演奏乐器没有那个频率,去哪里搞样本
作者: hikari34    时间: 2018-9-14 21:36

类似电视机的插帧呗
作者: bikebicycle    时间: 2018-9-14 21:59

同样目的的升频技术很多产品都有,我从来都不开,开了听不出区别。原生高采样音频文件和cd规格音频倒确实听感有别。
作者: ulric    时间: 2018-9-15 08:20

反正音质还是不如好手机
作者: jun4rui    时间: 2018-9-15 08:39

posted by wap, platform: GOOGLE Nexus 4
引用:
原帖由 @jjx01  于 2018-9-14 01:06 发表
原始演奏乐器没有那个频率,去哪里搞样本
音频业界采用的标准上采样最高是192kHz(48kHz为标准),176.4kHz是44.1kHz的最高上采样标准。
作者: T39的故事    时间: 2018-9-15 09:09

印象中在哪里看过一篇东西,我当时的理解是:把原本44.1khz的宽度,拉伸到更高的采样率宽度,然后通过采集每个采样单位附近的相似信息,填充满,大概就是这样吧,类似视频的插值。

但是大多数(优化出来)的效果都是听到很大电流声……
作者: jun4rui    时间: 2018-9-15 10:43

posted by wap, platform: Android
引用:
原帖由 @T39的故事  于 2018-9-14 13:09 发表
印象中在哪里看过一篇东西,我当时的理解是:把原本44.1khz的宽度,拉伸到更高的采样率宽度,然后通过采集每个采样单位附近的相似信息,填充满,大概就是这样吧,类似视频的插值。

但是大多数(优化出来)的效果都是听到很大电流声……
你这种算法是几十年前的东西了
作者: T39的故事    时间: 2018-9-15 11:32

引用:
原帖由 jun4rui 于 2018-9-15 10:43 发表
posted by wap, platform: Android
你这种算法是几十年前的东西了
有可能,甚至是看了一下老文章,反正记得曾经有这么一回事
作者: soloyu    时间: 2018-9-15 11:36

相当于美图秀秀,让你听起来好听,至于实际情况是不是这样,那就不保证了
作者: 9iNCHNaiLS    时间: 2018-9-15 11:38

数码变焦呗
作者: jjx01    时间: 2018-9-15 11:50

引用:
原帖由 jun4rui 于 2018-9-15 08:39 发表
posted by wap, platform: GOOGLE Nexus 4
音频业界采用的标准上采样最高是192kHz(48kHz为标准),176.4kHz是44.1kHz的最高上采样标准。
重采样要么和原来声音一样,要么多出噪音
作者: jjx01    时间: 2018-9-15 11:55

引用:
原帖由 T39的故事 于 2018-9-15 09:09 发表
印象中在哪里看过一篇东西,我当时的理解是:把原本44.1khz的宽度,拉伸到更高的采样率宽度,然后通过采集每个采样单位附近的相似信息,填充满,大概就是这样吧,类似视频的插值。

但是大多数(优化出来)的效果都 ...
声音不是这样还原的
只要一个周期内有两个采样点,波形就能完整还原
原来采样是44.1,用更高的采样重采样,最多只能做到44.1khz的效果,或者更劣化
作者: alexey    时间: 2018-9-15 14:26

这就是专门为取悦玄学爱好者设计的功能吧
作者: jun4rui    时间: 2018-9-15 17:36

posted by wap, platform: Android
引用:
原帖由 @jjx01  于 2018-9-14 15:50 发表
重采样要么和原来声音一样,要么多出噪音
不见得,深度学习技术改变了很多领域,老黄的20x0系显卡就是靠深度学习将1080p升频到4k的,按以前的算法说应该也会模糊什么的。
作者: T39的故事    时间: 2018-9-15 18:04

引用:
原帖由 jun4rui 于 2018-9-15 17:36 发表
posted by wap, platform: Android
不见得,深度学习技术改变了很多领域,老黄的20x0系显卡就是靠深度学习将1080p升频到4k的,按以前的算法说应该也会模糊什么的。
ps的智能填充同理吗?
作者: jun4rui    时间: 2018-9-15 18:08

posted by wap, platform: Android
引用:
原帖由 @T39的故事  于 2018-9-14 22:04 发表
ps的智能填充同理吗?
应该不是同理
作者: jjx01    时间: 2018-9-15 18:34

引用:
原帖由 jun4rui 于 2018-9-15 17:36 发表
posted by wap, platform: Android
不见得,深度学习技术改变了很多领域,老黄的20x0系显卡就是靠深度学习将1080p升频到4k的,按以前的算法说应该也会模糊什么的。
声音还原的原理不同
100hz的声音,你用44.1khz采样它放出来就是100hz,用再高采样放出来也还是100hz,或者不是100hz————更糟

非要类比升频的话,随便拿个磁带音质的老录音,你给重采样变成高清音质试试?这玩意运算量比压视频少多了吧

[ 本帖最后由 jjx01 于 2018-9-15 18:37 编辑 ]
作者: jinye2001    时间: 2018-9-15 20:00

posted by wap, platform: iPhone
引用:
原帖由 @jjx01  于 2018-9-15 18:34 发表
声音还原的原理不同
100hz的声音,你用44.1khz采样它放出来就是100hz,用再高采样放出来也还是100hz,或者不是100hz————更糟

非要类比升频的话,随便拿个磁带音质的老录音,你给重采样变成高清音质试试?这玩意运算量比压视频少多了吧
拜托先搞清楚那奎斯特定理是什么再来侃侃而谈吧,还原理不同,两点就能还原音频信号。初中生都知道两点只能还原一条直线。不论音频视频信号都没有单一频率的信号都是混叠信号,越高采样率失真越小
这广告最大的问题是外行翻译的,把采样率和声音频率混为一谈了,虽然单位都是Hz,但是完全是两回事

本帖最后由 jinye2001 于 2018-9-15 20:03 通过手机版编辑
作者: yangjuniori    时间: 2018-9-15 20:40

posted by wap, platform: iPhone
替你量化好?
作者: jjx01    时间: 2018-9-16 10:21

引用:
原帖由 jinye2001 于 2018-9-15 20:00 发表
posted by wap, platform: iPhone
拜托先搞清楚那奎斯特定理是什么再来侃侃而谈吧,还原理不同,两点就能还原音频信号。初中生都知道两点只能还原一条直线。不论音频视频信号都没有单一频率的信号都是混叠信号,越高 ...
噗,采样频率决定最高声音频率,不知道我来喷什么?现实乐器里没有需要高采样频率来还原的声音频率
两点只能还原一条直线喷了,圆心+圆上一点决定一个圆,学到了吗?

至于什么“混叠信号”,不同频率正弦波叠加的分离涉及的是傅立叶级数,直接将合成的波形变成各种正弦波配上参数数相加,整个过程最后要满足香农采样定理:
https://zhuanlan.zhihu.com/p/24334995
另外只有不满足采样定理,去还原波形出现时的多种信号同时存在情况才叫做“混叠”

[ 本帖最后由 jjx01 于 2018-9-16 10:39 编辑 ]
作者: reg-neo    时间: 2018-9-16 10:49

posted by wap, platform: iPhone
数字放大也是门学问,DVD画质用现在的解码器madvr之类倍线之后,画质也吊打之前,并不是啥玄学

同理,类似的功能,天龙的CD机上也有,直接插值到32比特,音感更好
作者: jjx01    时间: 2018-9-16 10:56

引用:
原帖由 reg-neo 于 2018-9-16 10:49 发表
posted by wap, platform: iPhone
数字放大也是门学问,DVD画质用现在的解码器madvr之类倍线之后,画质也吊打之前,并不是啥玄学

同理,类似的功能,天龙的CD机上也有,直接插值到32比特,音感更好
位宽影响的是音量,最终16bit输出已经足够让最小音量=人耳能听到的最低音量,最大音量=接近听就能听觉损伤的音量,并且每一阶音量都是最低音量的整数倍
重新提升位宽对提升听感毫无意义,增加了你听不出来的音量变化,在音频编辑的时候用高位宽才有意义。

[ 本帖最后由 jjx01 于 2018-9-16 11:12 编辑 ]
作者: reg-neo    时间: 2018-9-16 11:25

posted by wap, platform: iPhone
引用:
原帖由 @jjx01  于 2018-9-16 10:56 发表
位宽影响的是音量,最终16bit输出已经足够让最小音量=人耳能听到的最低音量,最大音量=接近听就能听觉损伤的音量,并且每一阶音量都是最低音量的整数倍
重新提升位宽对提升听感毫无意义,增加了你听不出来的音量变化,在音频编辑的时候用高位宽才有意义。
位宽主要影响的是精度,当然分贝也受这个影响

16比特就够的,好点儿的设备听听近几年的SACD,蓝光演唱会,一耳朵
作者: jinye2001    时间: 2018-9-16 11:30

posted by wap, platform: iPhone
引用:
原帖由 @jjx01  于 2018-9-16 10:21 发表
噗,采样频率决定最高声音频率,不知道我来喷什么?现实乐器里没有需要高采样频率来还原的声音频率
两点只能还原一条直线喷了,圆心+圆上一点决定一个圆,学到了吗?

至于什么“混叠信号”,不同频率正弦波叠加的分离涉及的是傅立叶级数,直接将合成的波形变成各种正弦波配上参数数相加,整个过程最后要满足香农采样定理:
https://zhuanlan.zhihu.com/p/24334995
另外只有不满足采样定理,去还原波形出现时的多种信号同时存在情况才叫做“混叠”
采样频率不光决定最高频率而且还直接决定了失真度
现实中任何信号都包含了无数频段的频率信息,高采样率当然对信号还原有好处
两点决定一个圆?还是那句话,怕是你初中都没毕业,初中生都知道三点确定一个圆
还声音信号还原只要两点,两点你给我还原个最简单的正弦信号看看
百度了这么久,还位宽只影响音量,你知道信号还原的失真度的定义就是通过信号能量来表征的么?

本帖最后由 jinye2001 于 2018-9-16 11:42 通过手机版编辑
作者: jjx01    时间: 2018-9-16 12:43

引用:
原帖由 jinye2001 于 2018-9-16 11:30 发表
posted by wap, platform: iPhone
采样频率不光决定最高频率而且还直接决定了失真度
现实中任何信号都包含了无数频段的频率信息,高采样率当然对信号还原有好处
两点决定一个圆?还是那句话,怕是你初中都没毕业, ...
圆心+圆上一点决定一个圆,学到了吗?小学学过用圆规吗

[ 本帖最后由 jjx01 于 2018-9-16 12:50 编辑 ]
作者: jjx01    时间: 2018-9-16 12:48

引用:
原帖由 reg-neo 于 2018-9-16 11:25 发表
posted by wap, platform: iPhone
位宽主要影响的是精度,当然分贝也受这个影响

16比特就够的,好点儿的设备听听近几年的SACD,蓝光演唱会,一耳朵
音量能2^16阶就叫16bit位宽,最低一阶是人耳能听到的最低音量,最高一阶在2^16倍就能让你听力受损
更细分成2^32阶,要么分成每阶是人耳能听到的最低音量的一半,听出每阶变化是挑战人类极限,要么就是每阶还是人耳能听到的最低音量,最高音量变成2^32倍,让耳朵更加受损
至于蓝光演唱会,sacd,你把它们转成16bit 44.1khz的wav比较过么,转完之后听起来一耳朵区别?

[ 本帖最后由 jjx01 于 2018-9-16 12:58 编辑 ]
作者: reg-neo    时间: 2018-9-16 14:07

posted by wap, platform: iPhone
16比特上不了110分贝的剧场最低要求吧?更别提115分贝

先天不足
作者: jjx01    时间: 2018-9-16 15:19

引用:
原帖由 reg-neo 于 2018-9-16 14:07 发表
posted by wap, platform: iPhone
16比特上不了110分贝的剧场最低要求吧?更别提115分贝

先天不足
距离多近去听115分贝?

https://www.bbc.com/ukchina/simp ... ut_damaging_hearing
引用:
莱斯特大学(University of Leicester)的一项研究显示,带有音乐播放器的耳机可以将声音强度调高到120分贝,而这个噪声声级是极具杀伤力的,因为噪声声级超过110分贝就会“剥离神经细胞中的髓磷脂鞘,进而对电子信号从双耳到大脑的传递过程造成阻碍。”如果你用这种方式损伤自己的听觉,那么其损伤是不能被修复的永久性的。

如果你早年间暴露于异常嘈杂的噪声环境中,那等你老了,你的听力损伤往往会更为严重。

“电动工具的噪声级大约为90分贝。”位于范德堡大学医疗中心里的听力及语言科学研究生院(Department of Hearing and Speech Sciences Graduate Studies)的教授兼系主任托德·里基茨(Todd Ricketts)博士说,“一把链锯、一个喷气式滑艇的噪声级大约为100分贝。或者你说到一个非常嘈杂的俱乐部、一场喧嚣的音乐会,那噪声级可以到105分贝。非常响亮的汽车音响,其噪声级甚至可能达到120分贝,或更高一点。如果离一支枪只有几英尺的距离,那么你听到的噪声级为140分贝,等同或超过疼痛阈值。”
引用:
歌劇院排練噪音致聽力受損 英樂手索賠664萬勝訴
https://kknews.cc/world/8lxpy3e.html
2018-03-30 由 新華網 發表于環球

來源:新華網

英國歌劇院中提琴手克里斯托弗·戈德沙伊德指控英國歌劇院對排練噪音導致他聽力受損負責,向樂團索賠75萬英鎊(約合664萬元人民幣),28日勝訴。

戈德沙伊德現年45歲。他告訴高等法院,2012年參加英國歌劇院排練瓦格納歌劇《女武神》時,他在一個狹窄樂池中坐在18名銅管樂器演奏者前,遭到超過130分貝的噪音「聲擊」,相當於坐在一台噴氣發動機邊上,排練後感到不適,耳鳴,頭暈,被迫放棄演奏樂器和聽音樂。

英國歌劇院卡文特加登基金會辯稱,戈德沙伊德的不適感源於排練期間患上美尼爾綜合症,而非排練本身,他的病與排練是個「巧合」。法官戴維斯認為這一說法「過分延伸了巧合的概念」,「音樂人像其他工作者一樣有權受到法律保護」,因而判定戈德沙伊德勝訴。賠償金額待定。

戈德沙伊德的律師克里斯·弗萊對英國廣播公司說,法庭裁決結果將「在整個音樂行業產生衝擊波」,「這一行業一向以藝術性質為由,認為可以不像其他行業那樣受到監管和遵守要求」。(歐颯)【新華社微特稿】
引用:
http://mw.bjd.com.cn/hq/201412/16/t20141216_8496600.html
音乐家亟需关注听力劳损问题
……
  那么,音乐家所承受的交响乐团声响的分贝是多少呢?
  研究结果表明:长笛乐器在奏出最强音符时,其声音的分贝很容易就可以达到112分贝,短笛可以达到120分贝以上。这就是说,笛子的声音足以造成听力的损坏。研究结果还表明,小号和长号发出的声音强度与长笛一样,可以达到106至112分贝之间。一个小提琴手的左耳尤其容易受到损伤,因为从小提琴发音孔产生的声音可以达到100分贝。
  理查德还对交响乐团在音乐厅的声音分贝进行了测试,其结果也很令人震惊:交响乐音乐厅的声音分贝可以达到110至120分贝。这个数据足以说明,长期排练和演出的音乐家们已经处于听力劳损的危险边缘。
  伊兰·奥布莱恩目前在澳大利亚悉尼大学的医学院担任教授。他对交响乐团的听力劳损问题所进行的研究时间更长。他认为,几乎所有的管弦乐团演奏家都或多或少存在听力损耗的问题,不少演奏家自己也意识到听力方面可能存在问题。然而,相比弦乐演奏家而言,铜管声部的演奏家们遭受听力损耗的比率更大。奥布莱恩认为,铜管演奏家的听力损耗甚至要比弦乐演奏家高出一倍之多。职业音乐家所受到听力损耗是非音乐家的4倍。
……
[ 本帖最后由 jjx01 于 2018-9-16 15:24 编辑 ]
作者: jinye2001    时间: 2018-9-16 15:33

posted by wap, platform: iPhone
一点信号分析的基础知识都不懂就敢侃侃而谈还抬杠,声强,失真度,分辨率这些东西能不能分清了再来聊这些,讨论到现在基本概念都搞不清,把这些东西混在一起扯东扯西
另外到底是两点决定一个圆还是三点你找你几何老师抬杠去,你看你抬杠圆规他会给你分不?
作者: Hibino    时间: 2018-9-16 15:47

反正人类也听不到那个频率,直接用sony老总说你是sb的录音调到高频率然后填充那个频率就行了
作者: jjx01    时间: 2018-9-16 18:28

引用:
原帖由 jinye2001 于 2018-9-16 15:33 发表
posted by wap, platform: iPhone
一点信号分析的基础知识都不懂就敢侃侃而谈还抬杠,声强,失真度,分辨率这些东西能不能分清了再来聊这些,讨论到现在基本概念都搞不清,把这些东西混在一起扯东扯西
另外到底是两 ...
理屈词穷了
小学都没学清楚跟我来谈两点只能还原一条直线,下面什么声强失真你就别装了,抬出些术语顾左右言它,没有半点干货,只有几何笑话看

[ 本帖最后由 jjx01 于 2018-9-16 18:32 编辑 ]
作者: LionHeart    时间: 2018-9-16 20:18

posted by wap, platform: Android
不就是个升频功能吗,大惊小怪,怎么就智商问题了。
作者: jinye2001    时间: 2018-9-16 20:20

posted by wap, platform: iPhone
引用:
原帖由 @jjx01  于 2018-9-16 18:28 发表
理屈词穷了
小学都没学清楚跟我来谈两点只能还原一条直线,下面什么声强失真你就别装了,抬出些术语顾左右言它,没有半点干货,只有几何笑话看
该说的该解释的一开始就解释了,初中都没毕业的你看不懂,我对牛谈琴有什么用?
作者: jjx01    时间: 2018-9-16 22:00

引用:
原帖由 LionHeart 于 2018-9-16 20:18 发表
posted by wap, platform: Android
不就是个升频功能吗,大惊小怪,怎么就智商问题了。
是的,就是智商问题
作者: jjx01    时间: 2018-9-16 22:03

引用:
原帖由 jinye2001 于 2018-9-16 20:20 发表
posted by wap, platform: iPhone
该说的该解释的一开始就解释了,初中都没毕业的你看不懂,我对牛谈琴有什么用?
噗,提升采样率就是为了还原超过22khz的声音,所以叫做“现实音乐里面本来就没有那些高频,去哪里还原去?”
你解释了半天,连提升采样率是为了做啥都不知道啊,知道奈荃斯特频率这个词不知道做啥用,所以我说你只会抬出些术语顾左右言它,没半点干货
引用:
奈奎斯特频率(Nyquist频率)是离散信号系统采样频率的一半,因哈里·奈奎斯特或奈奎斯特-香农采样定理得名。采样定理指出,只要离散系统的奈奎斯特频率高于被采样信号的最高频率或带宽,就可以避免混叠现象。

从理论上说,即使奈奎斯特频率恰好大于信号带宽(但不可相等),也足以通过信号的采样重建原信号。但是,重建信号的过程需要以一个低通滤波器或者带通滤波器将在奈奎斯特频率之上的高频分量全部滤除,同时还要保证原信号中频率在奈奎斯特频率以下的分量不发生畸变,而这是不可能实现的。在实际应用中,为了保证抗混叠滤波器的性能,接近奈奎斯特频率的分量在采样和信号重建的过程中可能会发生畸变。因此实际应用中信号带宽并不能无限接近奈奎斯特频率,具体的情况要看所使用的滤波器的性能。

例如,CD音频信号的采样频率为44100 Hz,那么它的奈奎斯特频率就是22050 Hz,这是CD音频数据所能表现的最高频率。如果选择的抗混叠滤波器(此处为低通滤波器)的过渡带宽为2000 Hz,这种情况下的截止频率最高只能为20050 Hz,而高于20050 Hz的信号能量都会被滤除。
[attach]1024344[/attach]
附送50khz以上超高频,让蝙蝠(侠)听出一耳朵差别,对蝙蝠(侠)来说,这真不是智商问题
对了,这种高频声音,音频界做母带录音怎么录的呢?抓蝙蝠来录啊————这是智商问题
实际上就是后期配上算法硬加进去,让人YY用的,录音时根本没这些音频

[ 本帖最后由 jjx01 于 2018-9-16 22:41 编辑 ]
作者: LionHeart    时间: 2018-9-16 23:47

posted by wap, platform: Android
引用:
原帖由 @jjx01  于 2018-9-16 22:00 发表
是的,就是智商问题
那你这是重大发现啊,你太操心了,就是晚了太多年。
作者: LionHeart    时间: 2018-9-16 23:56

posted by wap, platform: Android
让我笑一会
作者: 资深围观群众    时间: 2018-9-17 02:12

posted by wap, platform: Android
音频玄学辩论最终都会这样。谁也说服不了谁。
不过某人3点确定一个圆真是喷了
作者: jjx01    时间: 2018-9-17 15:01

引用:
原帖由 资深围观群众 于 2018-9-17 02:12 发表
posted by wap, platform: Android
音频玄学辩论最终都会这样。谁也说服不了谁。
不过某人3点确定一个圆真是喷了
不共线任意三点确定一个圆是没问题的,然而这个没错,无法说明“圆心+圆上一点确定一个圆”就是错的
[attach]1024433[/attach]
频谱图不属于玄学范围,高采样HD音频转44.1khz,0-20khz里的频率都在,最终放出来的声音是由哪几个频率的波叠加而成看得清清楚楚
作者: 甲级战犯他祖宗    时间: 2018-9-17 15:33

posted by wap, platform: iPad
这帖喷了

其实吧,这个世界有两种人:第一种人懂傅里叶变换,第二种人不懂

第一种人是不会相信这种玄学的,只有第二种人会。诚然第一种人数量不太多,绝大部分都是第二种人,所以玄学盛行
作者: reg-neo    时间: 2018-9-17 20:28

posted by wap, platform: iPhone
引用:
原帖由 @甲级战犯他祖宗  于 2018-9-17 15:33 发表
这帖喷了

其实吧,这个世界有两种人:第一种人懂傅里叶变换,第二种人不懂

第一种人是不会相信这种玄学的,只有第二种人会。诚然第一种人数量不太多,绝大部分都是第二种人,所以玄学盛行
我之前也是觉着放大只会劣化,原汁原味是最好

但现在MADVR播DVD倍线的例子证明,并非1:1还原材才是最佳,合适的方法也可能显著提升数字信号,当然这种数字信号放大绝不仅仅是傅立叶变换
作者: mushroom    时间: 2018-9-17 20:52

引用:
原帖由 reg-neo 于 2018-9-17 20:28 发表
posted by wap, platform: iPhone
我之前也是觉着放大只会劣化,原汁原味是最好

但现在MADVR播DVD倍线的例子证明,并非1:1还原材才是最佳,合适的方法也可能显著提升数字信号,当然这种数字信号放大绝不仅仅是傅 ...
图像插值和声音2回事

声音都是正弦波形,只要人类的听力上限不提高,高采样率就是bull shit。

[ 本帖最后由 mushroom 于 2018-9-17 20:57 编辑 ]
作者: reg-neo    时间: 2018-9-17 21:54

posted by wap, platform: iPad
引用:
原帖由 @mushroom  于 2018-9-17 20:52 发表
图像插值和声音2回事

声音都是正弦波形,只要人类的听力上限不提高,高采样率就是bull shit。
高采样看得多高了,至少24比特是高保真刚需吧
作者: doomking    时间: 2018-9-17 22:02

高采样率根本不能拿图像去马赛克类比,
要类比的话就是一段原始运动影像,一个用24FPS放,一个用120FPS放,和电视机插帧差不多。

但是不管你用多少FPS放,原始1080P你也不可能放出4K的清晰度。
这技术听感可能有提升,说提高声音解析度就是扯淡了。

这楼里好多人连采样频率和声音频率都分不清,233....

[ 本帖最后由 doomking 于 2018-9-17 22:08 编辑 ]
作者: lyz1196    时间: 2018-9-17 22:04

都四页了,都没见人提低通滤波器
作者: mushroom    时间: 2018-9-17 22:09

引用:
原帖由 reg-neo 于 2018-9-17 21:54 发表
posted by wap, platform: iPad
高采样看得多高了,至少24比特是高保真刚需吧
比特数只影响音量。
16bit的动态范围已经有96db了。
应该不会有音乐需要超出这个幅度了。
作者: grammyliu    时间: 2018-9-17 22:22

posted by edfc, platform: iPhone 6s
是有提升的,我在Mac上用Auirvana Plus这个软件也这样做,效果很好
作者: allensakura    时间: 2018-9-17 22:56

翔泥的目标群众一直以来都很明显,我相信RMAA测试一上这玩意又会露出原形
作者: LionHeart    时间: 2018-9-18 08:07

posted by wap, platform: Android
引用:
原帖由 @allensakura  于 2018-9-17 22:56 发表
翔泥的目标群众一直以来都很明显,我相信RMAA测试一上这玩意又会露出原形
这玩意普通手机上都可能有,会是什么好东西,好不好耳朵听了就知道。
作者: jun4rui    时间: 2018-9-18 08:13

posted by wap, platform: Android
引用:
原帖由 @doomking  于 2018-9-17 02:02 发表
高采样率根本不能拿图像去马赛克类比,
要类比的话就是一段原始运动影像,一个用24FPS放,一个用120FPS放,和电视机插帧差不多。

但是不管你用多少FPS放,原始1080P你也不可能放出4K的清晰度。
这技术听感可能有提升,说提高声音解析度就是扯淡了。

这楼里好多人连采样频率和声音频率都分不清,233....
你落伍了,NVIDIA的dlss技术就是把1080拉成4k 60fps的,了解一下
作者: LionHeart    时间: 2018-9-18 08:16

posted by wap, platform: Android
引用:
原帖由 @jjx01  于 2018-9-15 11:55 发表
声音不是这样还原的
只要一个周期内有两个采样点,波形就能完整还原
原来采样是44.1,用更高的采样重采样,最多只能做到44.1khz的效果,或者更劣化
别的不说,就这段,最多只能做到44.1khz效果,平时只靠眼睛听啊
作者: jjx01    时间: 2018-9-18 08:24

引用:
原帖由 reg-neo 于 2018-9-17 21:54 发表
posted by wap, platform: iPad
高采样看得多高了,至少24比特是高保真刚需吧
24bit是采样位深,不是采样频率
24bit在音频制作里有用,听音没用,要么听不出区别,要么听到听力受损
作者: jjx01    时间: 2018-9-18 08:26

引用:
原帖由 LionHeart 于 2018-9-18 08:16 发表
posted by wap, platform: Android
别的不说,就这段,最多只能做到44.1khz效果,平时只靠眼睛听啊
知道当年将44.1khz用48khz重采样播放搞得创新声卡被诟病的src问题吗
整数倍重采样最多就做到采样前效果,波形、频谱全部相同
作者: jjx01    时间: 2018-9-18 08:36

引用:
原帖由 jun4rui 于 2018-9-18 08:13 发表
posted by wap, platform: Android
你落伍了,NVIDIA的dlss技术就是把1080拉成4k 60fps的,了解一下
认为从1080到4k把锯齿边缘重新算一下就和音频里重采样类似,从一开始就是错的
频谱图摆在这里:
[attach]1024542[/attach]
从低采样到高采样,增加的是人耳听不到的高音部分,人耳能听到的部分完全相同

抗锯齿、优化画面这种图形技术在音频类比的是“音频修复”,用自动算法去除源录音里的爆音、嘶嘶音、自动降噪等等,跟音频重采样率播放关系都没有
降噪、去爆音时高位宽有效果,可以降低计算时额外产生的噪音音量,高采样率无用,该什么频率的声音还是什么频率的声音

[ 本帖最后由 jjx01 于 2018-9-18 08:45 编辑 ]
作者: 我懒    时间: 2018-9-18 08:43

引用:
原帖由 jjx01 于 2018-9-18 08:36 发表

认为从1080到4k把锯齿边缘重新算一下就和音频里重采样类似,从一开始就是错的
频谱图摆在这里:
1024542
从低采样到高采样,增加的是人耳听不到的高音部分,人耳能听到的部分完全相同

抗锯齿、优化画面这种图 ...
大大能不能发一个320kbps的mp3和wav对比的频谱图。
作者: LionHeart    时间: 2018-9-18 08:44

引用:
原帖由 jjx01 于 2018-9-18 08:26 发表

知道当年将44.1khz用48khz重采样播放搞得创新声卡被诟病的src问题吗
整数倍重采样最多就做到采样前效果,波形、频谱全部相同
你说原生44.1khz用48khz重采样播放?这种没有意义的事情做了干什么。
作者: jjx01    时间: 2018-9-18 09:07

引用:
原帖由 LionHeart 于 2018-9-18 08:44 发表

你说原生44.1khz用48khz重采样播放?这种没有意义的事情做了干什么。

原生44.1khz重采样,“扩大高频范围”,这算什么意义?
作者: jjx01    时间: 2018-9-18 09:08

引用:
原帖由 我懒 于 2018-9-18 08:43 发表


大大能不能发一个320kbps的mp3和wav对比的频谱图。
发出来然后呢?请把话说完
作者: LionHeart    时间: 2018-9-18 09:39

引用:
原帖由 jjx01 于 2018-9-18 09:07 发表


原生44.1khz重采样,“扩大高频范围”,这算什么意义?
升频功能,能不能“讨好耳朵”看算法看工程师水平,另外就是打广告宣传产品,就这些意义啊
作者: 甲级战犯他祖宗    时间: 2018-9-18 09:49

posted by wap, platform: iPad
升频喷了 把帕瓦罗蒂的highC升到highE吗?

44.1khz取样频率的直接结果是把22khz以上的信息给生生切掉了。既然切掉了,就算用一百亿赫兹再采样也是白搭啊
还是那句话,懂傅里叶变换的人和不懂的人区别就在这了
作者: LionHeart    时间: 2018-9-18 09:53

引用:
原帖由 甲级战犯他祖宗 于 2018-9-18 09:49 发表
posted by wap, platform: iPad
升频喷了 把帕瓦罗蒂的highC升到highE吗?

44.1khz取样频率的直接结果是把22khz以上的信息给生生切掉了。既然切掉了,就算用一百亿赫兹再采样也是白搭啊
还是那句话,懂傅 ...
卧槽你好懂行不行,再凑几个看起来很高大上的名词来呢

是的,你看十来万的CD机还有升频功能呢,他们都不懂的,都说了“讨好耳朵”,有没有用又不一定的,DSEE HX我反正是不会开的,并不讨好我的耳朵。
作者: 甲级战犯他祖宗    时间: 2018-9-18 09:55

posted by wap, platform: iPad
我不懂行,我只知道玄学很有市场,有空嘲笑一下很补充优越感啊
作者: LionHeart    时间: 2018-9-18 09:57

posted by wap, platform: Android
怎么能跟懂傅里叶变换比优越感,没得比啊
作者: LionHeart    时间: 2018-9-18 09:59

话说就知道发表情的人,知道升频的真实意义是什么吗,拉个毛高频啊,我也就看见大法吹嘘拉高频了,别家也不会拿个升频做卖点的
作者: hourousha    时间: 2018-9-18 11:08

引用:
原帖由 LionHeart 于 2018-9-18 08:44 发表
你说原生44.1khz用48khz重采样播放?这种没有意义的事情做了干什么。
这是当年AC97软声卡的锅,无论什么源都在内部以48Khz处理并输出。而一般软声卡驱动里的重采样算法都做的很简单,所以对于非48的音频(比如CD),出来的效果都变得很糟糕。因此像foobar2k这种才加上了前置重采样功能,用比较好的算法把音频给重采样成48再发给系统。
作者: doomking    时间: 2018-9-18 11:10

posted by wap, platform: Samsung
引用:
原帖由 @jun4rui  于 2018-9-18 08:13 发表
你落伍了,NVIDIA的dlss技术就是把1080拉成4k 60fps的,了解一下
你连我什么意思都没看懂,先去了解下数字音频是怎么采样的吧。
作者: jun4rui    时间: 2018-9-18 11:15

posted by wap, platform: iPhone
引用:
原帖由 @doomking  于 2018-9-17 15:10 发表
你连我什么意思都没看懂,先去了解下数字音频是怎么采样的吧。
可能是,不过谁先弄明白下,索尼这个是怎么用深度学习升至176.4kHz的?
作者: doomking    时间: 2018-9-18 11:16

posted by wap, platform: Samsung
引用:
原帖由 @jjx01  于 2018-9-18 08:36 发表
认为从1080到4k把锯齿边缘重新算一下就和音频里重采样类似,从一开始就是错的
频谱图摆在这里:
1024542
从低采样到高采样,增加的是人耳听不到的高音部分,人耳能听到的部分完全相同

抗锯齿、优化画面这种图形技术在音频类比的是“音频修复”,用自动算法去除源录音里的爆音、嘶嘶音、自动降噪等等,跟音频重采样率播放关系都没有
降噪、去爆音时高位宽有效果,可以降低计算时额外产生的噪音音量,高采样率无用,该什么频率的声音还是什么频率的声音
整数倍高采样怎么会增加高频信息?
44k采样的时候高于22k的信息会失真应该已经用滤波器滤掉了,高采样又不会无中生有。
作者: doomking    时间: 2018-9-18 11:18

posted by wap, platform: Samsung
引用:
原帖由 @jun4rui  于 2018-9-18 11:15 发表
可能是,不过谁先弄明白下,索尼这个是怎么用深度学习升至176.4kHz的?
说了这个原理上就和fps插帧类似,和dlss那种原理是2回事,提高采样率不会改变声音频率。
你指望它改善解析力是不可能的,改善听感是有可能的。
作者: jun4rui    时间: 2018-9-18 11:24

posted by wap, platform: iPhone
引用:
原帖由 @doomking  于 2018-9-17 15:18 发表
说了这个原理上就和fps插帧类似,和dlss那种原理是2回事,提高采样率不会改变声音频率。
你指望它改善解析力是不可能的,改善听感是有可能的。
但是深度学习现在很多实际上的例子都表明,确实可以实现某种程度上的”无中生有“
作者: 甲级战犯他祖宗    时间: 2018-9-18 11:30

posted by wap, platform: iPad
我觉得这和插帧完全不是一回事。插帧是发生在时域的,而取样影响的是频域
插帧是两张画面中间真的无中生有给插了第三张画面,这个4倍频再采样出来的结果是不会无中生有的。别说4倍,就算是四百倍再采样,22khz以上的频域信息没有不能变成有
作者: doomking    时间: 2018-9-18 11:30

posted by wap, platform: Samsung
引用:
原帖由 @jun4rui  于 2018-9-18 11:24 发表
但是深度学习现在很多实际上的例子都表明,确实可以实现某种程度上的”无中生有“
dlss可不是无中生有,是nv自己先跑过相应游戏画面的高分辨率,然后用在超级计算机上训练形成预测模型。
但是音频是不存在这个概念的,原始音频采样时候的数字信号就已经定死了声音频率和曲线。
作者: doomking    时间: 2018-9-18 11:33

posted by wap, platform: Samsung
引用:
原帖由 @甲级战犯他祖宗  于 2018-9-18 11:30 发表
我觉得这和插帧完全不是一回事。插帧是发生在时域的,而取样影响的是频域
插帧是两张画面中间真的无中生有给插了第三张画面,这个4倍频再采样出来的结果是不会无中生有的。别说4倍,就算是四百倍再采样,22khz以上的频域信息没有不能变成有
傅立叶变换后还是要一个个点取样转模拟输出到二级口的,提高采样率等于提高了取样率,声音会更平滑,这点索尼倒是没说错的。
作者: allensakura    时间: 2018-9-18 11:35

23333,翔泥深度学习都来了
作者: allensakura    时间: 2018-9-18 11:37

引用:
原帖由 doomking 于 2018-9-18 11:33 发表
posted by wap, platform: Samsung
傅立叶变换后还是要一个个点取样转模拟输出到二级口的,提高采样率等于提高了取样率,声音会更平滑,这点索尼倒是没说错的。
24bit采样也能吹,都2018了那家dac不是内部32bit采样?
作者: LionHeart    时间: 2018-9-18 11:39

引用:
原帖由 allensakura 于 2018-9-18 11:37 发表

24bit采样也能吹,都2018了那家dac不是内部32bit采样?
大法这个是低端播放器,而且是吹给一般大众看的
作者: 甲级战犯他祖宗    时间: 2018-9-18 11:39

posted by wap, platform: iPad
引用:
原帖由 @doomking  于 2018-9-18 11:33 发表
傅立叶变换后还是要一个个点取样转模拟输出到二级口的,提高采样率等于提高了取样率,声音会更平滑,这点索尼倒是没说错的。
按我的理解整个过程是这样的:
44khz采样获得的数字信号 -> 数模转换 -> 模拟信号 -> 176khz再采样获得数字信号 -> 再数模转换 -> 模拟音频

如果以上理解是对的,那我只能说:1)176khz再采样多出来的信息只能来自于第一次数模转换带来的杂质 2)两次数模转换纯属脱裤子放屁倒也罢了玄学爱好者能忍?

本帖最后由 甲级战犯他祖宗 于 2018-9-18 11:44 通过手机版编辑
作者: doomking    时间: 2018-9-18 11:44

posted by wap, platform: Samsung
引用:
原帖由 @甲级战犯他祖宗  于 2018-9-18 11:39 发表
按我的理解整个过程是这样的:
44khz采样获得的数字信号 > 数模转换 > 模拟信号 > 176khz再采样获得数字信号 > 再数模转换 > 模拟音频

如果以上理解是对的,那我只能说:1)176khz再采样多出来的信息只能来自于第一次数模转换带来的杂质 2)两次数模转换玄纯属脱裤子放屁倒也罢了学爱好者能忍?
没有第一次数模转换的,原始数字音频滤波完直接用高采样率采,信息不会变化(可能还会有多的杂讯),时域信号变得更平滑。
作者: doomking    时间: 2018-9-18 11:45

posted by wap, platform: Samsung
引用:
原帖由 @allensakura  于 2018-9-18 11:37 发表
24bit采样也能吹,都2018了那家dac不是内部32bit采样?
本来就是卖信仰的,还指望大法真有黑科技么。
作者: 甲级战犯他祖宗    时间: 2018-9-18 11:49

posted by wap, platform: iPad
引用:
原帖由 @doomking  于 2018-9-18 11:44 发表
没有第一次数模转换的,原始数字音频滤波完直接用高采样率采,信息不会变化(可能还会有多的杂讯),时域信号变得更平滑。
这个真喷了。以我羸弱的信号处理知识,采样(sampling)永远是对模拟信号(时域连续)而言的。从来没听说过可以对数字信号(时域离散)进行采样。骚尼真是突破我的认知
作者: allensakura    时间: 2018-9-18 11:53

引用:
原帖由 甲级战犯他祖宗 于 2018-9-18 11:39 发表
posted by wap, platform: iPad
按我的理解整个过程是这样的:
44khz采样获得的数字信号 -> 数模转换 -> 模拟信号 -> 176khz再采样获得数字信号 -> 再数模转换 -> 模拟音频

如果以上理解是对的,那我只能说:1) ...
PWM如果采用跟原音频相同的采样率确实会导致大量高频杂音,这是早期数字功放的共通问题,所以被喷的很惨
解决方法是超采样,将产生杂讯的频率上移到原始音频不存在的频率,再用低通率波器过滤掉高频杂讯

[ 本帖最后由 allensakura 于 2018-9-18 12:00 编辑 ]
作者: doomking    时间: 2018-9-18 11:58

posted by wap, platform: Samsung
引用:
原帖由 @甲级战犯他祖宗  于 2018-9-18 11:49 发表
这个真喷了。以我羸弱的信号处理知识,采样(sampling)永远是对模拟信号(时域连续)而言的。从来没听说过可以对数字信号(时域离散)进行采样。骚尼真是突破我的认知
什么鬼,升频的采样率就是fft里的fs啊,又不是录音设备记录数据那个频率。
作者: 甲级战犯他祖宗    时间: 2018-9-18 12:06

posted by wap, platform: iPad
引用:
原帖由 @doomking  于 2018-9-18 11:58 发表
什么鬼,升频的采样率就是fft里的fs啊,又不是录音设备记录数据那个频率。
抱歉,我不知道如何对数字信号采样,更不知道如何对数字信号fft。大法最高不断突破上限屌炸天
作者: mushroom    时间: 2018-9-18 12:08

引用:
原帖由 doomking 于 2018-9-18 11:44 发表
posted by wap, platform: Samsung
没有第一次数模转换的,原始数字音频滤波完直接用高采样率采,信息不会变化(可能还会有多的杂讯),时域信号变得更平滑。
对数字信号滤什么波?采什么样?
作者: doomking    时间: 2018-9-18 12:23

posted by wap, platform: Samsung
引用:
原帖由 @mushroom  于 2018-9-18 12:08 发表
对数字信号滤什么波?采什么样?
原始数字信号22k以上频率又不可能完全截断,高采样后能量会变化,不滤波还能怎么办。
作者: mushroom    时间: 2018-9-18 12:34

引用:
原帖由 doomking 于 2018-9-18 12:23 发表
posted by wap, platform: Samsung
原始数字信号22k以上频率又不可能完全截断,高采样后能量会变化,不滤波还能怎么办。
...
Im sorry,完全看不懂
所谓数字信号就是16bit的数列对吧。数列的每个单元都是一个16bit的数字对吧。
这个数列的产生是不是从包含了高于22khz的模拟信号上取得的已经没有办法得知了对吧。

我们怎么能够从一个单纯的16bit的数字上找到来源于高于22khz的部分并把它过滤掉呢?
作者: doomking    时间: 2018-9-18 12:43

posted by wap, platform: Samsung
引用:
原帖由 @mushroom  于 2018-9-18 12:34 发表
...
Im sorry,完全看不懂
所谓数字信号就是16bit的数列对吧。数列的每个单元都是一个16bit的数字对吧。
这个数列的产生是不是从包含了高于22khz的模拟信号上取得的已经没有办法得知了对吧。

我们怎么能够从一个单纯的16bit的数字上找到来源于高于22khz的部分并把它过滤掉呢?
可以得知的,傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合,所谓低通滤波就是把转换后高于22khz部分的正弦波去掉,这部分通常是杂讯。
作者: mushroom    时间: 2018-9-18 12:54

引用:
原帖由 doomking 于 2018-9-18 12:43 发表
posted by wap, platform: Samsung
可以得知的,傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合,所谓低通滤波就是把转换后高于22khz部分的正弦波去掉,这部分通常是杂讯。
1 “傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合”  就是 数字信号转乘模拟信号对吧 接下来的处理都是在模拟信号上进行的对吧。

2 44.1khz的采样率的数字信号转成模拟信号后,怎么会包含高于22khz的正弦波的音频信号的?
如果音源里本身包含高频信号,没有在采样前被过滤的话,那么数字信号里面就会包括杂音,但是采样率只有44.1khz,在转回模拟信号是就会出现失真。这已经是没法处理的了。
要能正确的解析出这个高频信号,意味着采样率必须高于音频信号频率的2倍。比如说40khz的音频只有在被大于80khz的采样率采样后,才能被正确的解析出来。
作者: jjx01    时间: 2018-9-18 13:07

引用:
原帖由 甲级战犯他祖宗 于 2018-9-18 11:30 发表
posted by wap, platform: iPad
我觉得这和插帧完全不是一回事。插帧是发生在时域的,而取样影响的是频域
插帧是两张画面中间真的无中生有给插了第三张画面,这个4倍频再采样出来的结果是不会无中生有的。别说4倍, ...
频域的类比是不同解析度画面里的去摩尔纹
所以根本就不是一类东西
作者: doomking    时间: 2018-9-18 13:08

posted by wap, platform: Samsung
引用:
原帖由 @mushroom  于 2018-9-18 12:54 发表
1 “傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合”  就是 数字信号转乘模拟信号对吧 接下来的处理都是在模拟信号上进行的对吧。

2 44.1khz的采样率的数字信号转成模拟信号后,怎么会包含高于22khz的正弦波的音频信号的?
如果音源里本身包含高频信号,没有在采样前被过滤的话,那么数字信号里面就会包括杂音,但是采样率只有44.1khz,在转回模拟信号是就会出现失真。这已经是没法处理的了。
要能正确的解析出这个高频信号,意味着采样率必须高于音频信号频率的2倍。比如说40khz的音频只有在被大于80khz的采样率采样后,才能被正确的解析出来。
不是, 从头到尾都是数字信号啊,哪来的模拟信号,滤波器对高频信号不是完全截断的是个类似瀑布的曲线,原始音频信号采集的时候就已经滤过一遍,但是升频后已经截断的那部分高频能量会发生变化所以还要滤波。
模拟信号是信号已经处理完了最后dac部分的事情。
作者: jjx01    时间: 2018-9-18 13:11

引用:
原帖由 doomking 于 2018-9-18 12:43 发表
posted by wap, platform: Samsung
可以得知的,傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合,所谓低通滤波就是把转换后高于22khz部分的正弦波去掉,这部分通常是杂讯
因为乐器、人声都到不了这个频率,所以叫它们“杂讯”

傅立叶变换展开之后的项数是无穷的,高过人耳频率的项直接去掉,还原之后听起来毫无区别
不过示波器里可以看到区别,人耳永远到不了仪器能“听”的频率
作者: allensakura    时间: 2018-9-18 13:13

引用:
原帖由 mushroom 于 2018-9-18 12:54 发表


1 “傅立叶变换就是把离散的时域信号转换成不同频率的正弦波的组合”  就是 数字信号转乘模拟信号对吧 接下来的处理都是在模拟信号上进行的对吧。

2 44.1khz的采样率的数字信号转成模拟信号后,怎么会包含高于 ...
1.理论上如此,实际上没这么美好
2.原始音频确实不包含,超采样也不会产生,而是在数模转换的时候产生的,只要产生杂讯的频率远高于人耳能听到频率就能通过低波滤波率除杂讯而不对原始音频造成失真




欢迎光临 TGFC Lifestyle (http://club.tgfcer.com/) Powered by Discuz! 6.0.0