关于奈奎斯特采样定理和高解析音频之我见
耳机吧
全部回复
仅看楼主
level 13
天书馆主 楼主
最近耳吧不少人在讨论音频采样方面的理论,本人既不是电子专业也非相关开发人员,只是因为对音乐的爱好和从事与音乐相关的工作,自觉理论欠缺所以搜集了一些资料,再加上有限的实践形成自己的理解,写出来与大家讨论。如有欠缺之处还请大家包涵指正!
2015年01月08日 11点01分 1
level 13
天书馆主 楼主
2015年01月08日 11点01分 2
level 12
留名
2015年01月08日 11点01分 3
level 13
天书馆主 楼主
首先关于CD音质,它是数字音频史上妥协的产物。CD的数码声一直被老烧诟病,尤其在模拟时代就已经入烧的发烧友,被LP唱片培养出来的耳朵,几乎没法认同CD的音质。终其原因,还是采样规格过低,无法记录足够大的信息量,以至于无法还原足够真实的声音。
44.1KHz采样率,在我看来确实是低了。而CD的支持者往往拿奈奎斯特采样定理作为理论依据,认为人耳可闻的20KHz以内音频使用44.1KHz采样就足够,我认为是对奈奎斯特采样定理的误解。
2015年01月08日 11点01分 4
level 13
天书馆主 楼主
网络上对奈奎斯特采样定理有很多种表述,其本质是一致的,这里采用百度百科的定义:
为了不失真地恢复模拟信号,采样频率应该不小于模拟信号频谱中最高频率的2倍。
2015年01月08日 11点01分 5
level 13
天书馆主 楼主
对于“2倍”这个数值,没有疑问。疑问在于“2倍”这个数值的意义如何理解。我个人的理解,“2倍”是理想条件下的极小值。怎样的理想条件?
波形尽可能简单,比如正弦波,采样点位于相邻的波峰和波谷,它可以被不失真恢复。
此时采样频率等于正弦波频率的2倍。
如果采样频率降低,则此正弦波被恢复时一定会失真。
模拟信号频谱中频率均不大于此正弦波频率,则在此采样频率下有机会被不失真恢复。
好了,这是我的理解。定理简明扼要,对“不小于”这三个字应该这样理解。所以“2倍”是理想条件下的极小值,定理并没有说2倍的采样频率足够恢复所有的模拟信号。
2015年01月08日 11点01分 6
修正:”采样点位于相邻的波峰和波谷”应为“相邻两个采样点位于相邻的波峰和波谷”
2015年01月09日 09点01分
@90后的小奶粉 简单说达到两倍不一定能还原,但是低于两倍一定还原不了
2015年01月12日 05点01分
回复 天书馆主 :同意~
2015年01月12日 05点01分
回复 90后的小奶粉 :13楼@FaLsis 的表述很准确, CD是保证数字信号包含人耳能听到的频率的最低要求
2015年01月12日 05点01分
level 7
44.1khz 只是保证高频不损失,但还是很重的数码味,而采样率再往高就和还原高频没什么关系了,纯粹是更接近模拟信号罢了
2015年01月08日 11点01分 7
level 11
就好像mp3,320k的音质,就是人极限听力来一刀啊,可是就是有人能听出区别,高端设备就是天差地别
2015年01月08日 11点01分 8
MP3是有损压缩,因为压缩算法损失的音质,和采样规格损失的音质应该分开讨论
2015年01月09日 00点01分
level 13
天书馆主 楼主
对此解释,至少有以下依据。
第一,大家熟知的无压缩CD码率计算1411200
bp
s=44100Hz*16bit*2ch,每声道每个采样点只有16位二进制码用于记录动态,没有更多信息。它能恢复最高频率为22050Hz不同响度的正弦声波。非正弦波当然会失真,再往下看。
2015年01月08日 11点01分 9
level 13
天书馆主 楼主
查术语ing晚上继续
2015年01月08日 11点01分 10
level 13
听到奶奎斯特就想起差点挂了的机电过程控制系统
2015年01月08日 11点01分 11
机电控制和采样是两码子事
2015年01月09日 00点01分
level 8
CD其实就是画了一张表 把一秒分成x 44100 y 65535份 然后模拟信号在这张表上取最通过的接近的点 因为不可能全部都刚好通过这些点 所以会有失真 采样多了 比特率高了 只会让失真幅度减少 和频率毛关系没有 因为CD的采样方式已经达到甚至超过了人能听到的频率了
2015年01月08日 11点01分 13
通过这张表最接近的点 爪机编辑的时候选错位置 不知道这么说会不会明白
2015年01月08日 11点01分
怕被人误解 我的意思是说 CD是保证数字信号包含人耳能听到的频率的最低要求 更高的采样和比特率是为了减少采样失真 而不是为了记录更高的频率
2015年01月08日 11点01分
回复 FaLsis :既然X分成44100份,高频声波取不到完整的波形,比如11025Hz只有四个采样点
2015年01月09日 00点01分
回复 天书馆主 :所以说啊 CD只能保证信号所包含的频率覆盖人耳的听力范围 而不能保证不失真。只要是这种四舍五入的量化采样 就会有失真,而且这种失真还是全频段噪声。这是PCM采样方式所注定的问题(解决方法就是……DSD……)
2015年01月09日 05点01分
level 13
天书馆主 楼主
第三,11025Hz的正弦波和方波都被恢复成正弦波,是不是错觉,或者说人耳不能分辨同频下的这两种波形?于是再用信号源生成14700Hz也就是44.1KHz的三分之一的正弦波和方波,这次音箱发出的声音完全不同。于是可以证明11025Hz正弦波和方波都被恢复成正弦波,并不是人耳的错觉。
2015年01月08日 11点01分 15
回复 DrimWondr :我可没有说过14700Hz的声波被正确还原了。只是通过对比,11025Hz正弦波和方波被还原后听上去一致,而14700Hz正弦波和方波听起来完全不同,说明这四种声波至少有一种没有被正确还原,也说明人耳对这两个频率的辩识不仅仅是频率和响度差异,还有波形
2015年01月09日 08点01分
回复 DrimWondr :其实我的结论在楼下,即使是11025Hz的声波也不能被正确还原。如果你不相信耳朵,我觉得没有必要继续讨论。
2015年01月09日 09点01分
level 13
天书馆主 楼主
好了,即使理想条件下,44.1KHz采样率恢复11025Hz的声波尚且会失真,非理想条件下不失真的声音频率还要更低,因为真实的声音涉及到波形还涉及到相位差。百度百科也有说明,通常使用5到10倍采样率。
所以奈奎斯特采样定理并不能作为支持CD音质的理由。
2015年01月08日 11点01分 16
修正:本楼“理想条件”和6楼不同。本楼的理想条件是指忽略相位差的情况。
2015年01月09日 00点01分
level 6
这么理解比较吃力。尝试一下这个办法:
在音频中,不良信号的产生全部归于失真,噪音也是失真的一部分。鉴于音频领域用动态范围代替信噪比,则可得出结论一:
噪音会降低有效动态范围,即末端设备难以高效取出有效音频信号。
如将一切波形的采样失真抽象成噪音频谱,则可以发现,有效信号的损失均与各类噪声的产生有关,而高频采样精度下降,则会造成高频采样噪音的累加。导出结论二:
要达到更高指标的还原原始信号,高频采样率噪声在频谱中占比较大。
高采样率,是降低了高频采样噪声。而眼下的各类Delta-Sigma DAC芯片,均在数字滤波器、插值计算的基础上解决这一问题,插值计算将累加精度错误造成的噪声,推向更高频。
又鉴于插值计算无法通过算法进一步提高指标,则可以导出结论:
数字滤波器的设计,成为眼下音频DAC声效、指标的重要(非唯一)因素。
所以我们看到,各家厂也是这么干的,从9018的高倍插值DSP、AD1955的高效数字滤波器、旭化成的可变响应数字滤波器,无一不是决定了这些芯片性能和声音特点的主要因素。
2015年01月08日 12点01分 17
层主讨论的是解码过程?
2015年01月09日 00点01分
回复 DrimWondr :理论始终停留在理论上,hifidiy上的几个大讨论,牵出了一帮学信号系统的人,最终的结论就是LP的噪音是硬伤,再有等化曲线致命。
2015年01月09日 07点01分
level 6
那么从上述结论可以逆向得出结论:
录音时应采用能最大程度记录下高频信号的手段,即录音时即应该采用高解析度录音,则向下降低解析度压制CD时才会有效。而录音时为模拟录音、16bit\48khz录音,则注定采样时即引入噪音,这样的录音即便进行高解析度重采样也于事无补。
2015年01月08日 12点01分 18
level 13
电气工程大三生路过,3天前才考的自动控制原理[冷]
2015年01月08日 13点01分 20
控制原理和采样定理木有关系吧
2015年01月09日 01点01分
回复 天书馆主 :有关系啊,香农采样定理,乃奎斯特定理都有
2015年01月09日 01点01分
回复 sc_bgl :你们只考理论层?应用层面你怎么看
2015年01月09日 01点01分
回复 天书馆主 :说起应用就蛋疼,我们下学期要在实验室呆一个月做相关设计[泪]
2015年01月09日 01点01分
level 10
我就知道控制工程用奈奎斯特
2015年01月08日 13点01分 21
那用不到采样定理
2015年01月09日 01点01分
level 13
精华帖
我定了
2015年01月08日 13点01分 22
level 1
上升下降沿无限快的方波理论上频谱是无限宽的,采样频率理论上是要2*无限宽。这个无限宽也是等效成最高频谱里面的最高正弦后的理论值。
2015年02月04日 02点02分 24
别纠结方波啦,如果换成高频椭圆声波,人耳未必能分辨它和同频同振幅的正弦波之间的差异。
2015年02月05日 08点02分
但是音色会变
2015年02月05日 08点02分
@hd19852008 在44.1KHz采样下11025Hz的正弦波和椭圆波听起来是一样的,这就有两种可能,一是人耳不能分辨音色的差异,二是其中至少一种声波失真了。两种情况可以并存。我的实验条件没法排除第一种可能,所以加了14700Hz实验。这才得出结论,两种频率四种声波至少有一种失真了。
2015年02月05日 10点02分
1 2 尾页