我已经问了一下音量正常化 。 在大多数的方法(例如播放增益 ,其中我最感兴趣的),我可能会超出PCM限制(如也可以读峰值这里 )。
简单的剪裁很可能是我可以做的最糟糕的事情。 维基百科显示 ,我应该做某种形式的动态范围压缩 。
我只是讲,我正在申请在每个单独的PCM采样值的功能。 另一个类似的问题 , 一个答案表明,这样做是不够的或不是我应该做的事。 不过,我真的不明白,我还是要处理的剪辑情况。 其答案是否建议做对多个样本的范围压缩一次,并做简单的硬限幅,除了对每个样品?
离开那一边,维基百科的文章中讨论的功能似乎是有些我想(在很多情况下,我还是会有最终的剪辑情况)不是。 我正在考虑使用类似正切 。 那是一个糟糕的主意? 这将略微减少量,但保证,我没有得到任何剪辑。
我的应用程序是一个通用的音乐播放器。 我正在寻找这主要是最适合每一个人,让我可以随时打开它,并在用户很可能并不想关闭这个功能的解决方案。
使用任何瞬时动态范围的处理(诸如削波或双曲正切非线性)将引入可听失真。 将一个正弦波到瞬时非线性函数,你不再有一个正弦波。 虽然某些音频应用,它听起来就像你不希望这些文物。
归一化不影响动力学(在最小/最大比计)的波形的。 标准化涉及波形的逐元素乘以一个常数标值,以确保没有样品曾经超过最大值。 这个过程只能通过离线进行,因为你需要处理之前分析整个信号。 规范化也是,如果你的波形包含任何激烈的瞬态一个坏主意。 整个信号将被瞬时峰值由削波阈值划分的比率衰减。
如果你只是想保护输出从裁剪你最好使用侧链条式压缩机。 这方面的一个特定形式是限幅器(上面零攻击阈值时间无穷大的压缩比)。 侧链压缩机计算信号平滑能量包络,然后根据该函数施加变化的增益。 他们不是瞬间的,所以你减少音频失真,你会从你所提到的功能得到。 限制器可以瞬发攻击削波,以防止,但你让一个释放时间,使限幅器仍然衰减后续波形的峰值,随后的波形刚满下来,所以没有失真。 激烈的声音后,限幅器恢复。
如果有很多的波形高强度峰你可以从这种类型的处理泵送类型的声音。 如果这成为问题,然后你可以移动到一个新的水平和子带内做动态处理。 这样一来,只有频谱的违规部分将被削弱,使声音不受影响的其余部分。
一般的解决方法是标准化的一些增益水平显著低于1,使得很少有歌曲需要增加增益。 换句话说,大部分的时间你会被降低的信号,而不是增加的量。 实验用各种不同风格的歌曲要弄清楚这个级别是什么。
现在,偶尔,你还是会遇到需要足够的增益,即,在某些时候,它就会夹一首歌。 你有两个选择:1,不要添加太多增益。 这一次歌会听起来有点安静。 这就是生活。 (这是一种常见的方法),或2.应用动态范围压缩和/或限制的量小。 当然,你也可以做一些组合1和2。我相信,iTunes会使用的1和2的组合,但他们已经很努力在#2,和它们应用很少。
您的建议,使用像正切函数,对样品的采样的基础上,会导致音频失真。 你不想为一个通用的音乐播放器做到这一点。 这是这种东西在吉他音箱模拟器做,使他们的声音“脏”和“蹩脚”。 这可能不是摇滚,流行,或其他现代音乐这是对失真重已经听得见,但在认真记录合唱,爵士乐或独奏小提琴音乐的人都会被打乱。 这有没有关系正切的选择,顺便说一句,任何非线性函数会产生变形。
动态范围压缩采用了应用于随时间的信号包络: http://en.wikipedia.org/wiki/Dynamic_range_compression这是棘手得到正确的,你永远无法创建一个压缩机是真正的“透明”。 限制器可以被看作是一个压缩机,该压缩机(至少在理论上)防止超过一定水平向信号的一个极端的版本。 数字“前瞻”限制器可以这样做,没有明显的裁剪。 在正确使用时,它是相当透明的。
如果采取这种方法,确保此功能可以被关闭,因为无论你怎么透明认为这是,有人会听到它,不喜欢它。