关于语言清晰度(可理解性)的深入洞察(三)
来源:同创音频 编辑:ZZZ 2024-06-26 08:52:38 加入收藏
在上一期中,我们深入探讨了语音频谱、共振峰以及影响语言清晰度的关键因素。本期,我们将聚焦声场对语言清晰度的影响,并为大家总结麦克风放置的实用规则。
关于声场对语言清晰度的影响
在探讨声场对语言清晰度的影响时,一个关键的观察点是声音的指向性,即声音在不同方向上传播的强度和特性。通过精心设计的实验和测量,我们可以观察到声场中的诸多细节,这些细节对于理解如何捕捉和传达清晰的语言至关重要。
当发言人发言时,其声音不仅受到周围声场环境的影响,还受到人的头部和身体的影响。这种影响在多个维度上展现,包括指向性、距离与方向、以及头部和胸部的反射等。
下面是人类说话者在垂直和水平平面上的极坐标图。
(参考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
首先,值得注意的是,当我们绘制出人类说话者在垂直和水平平面上的极坐标图时,可以发现一个明显的现象:电平在经过A加权后,男性和女性在正面和背面之间的差值大约为7dB。这意味着声音在直接面对的方向上最为强烈,而在背后则相对较弱。
然而,这一数据并没有揭示出关于频率相关性的全部信息。事实上,高频声音在背面的衰减比低频声音更为显著。这一发现对于麦克风的选择和放置位置具有指导意义,因为它意味着为了捕捉更多的高频细节,麦克风需要更加靠近说话者的正面。
(参考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
从上图可以看出,方向性从大约1kHz及以上增加。将这一事实与1kHz以上频率的重要性相结合,很明显,当在人前面而不是在人后面拾音时,可以获得更高的可懂度。
(参考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
此外,在垂直面上,我们注意到一个有趣的细节:与其他方向相比,330°方向(大致指向胸部区域)的水平面更高。这并非偶然,而是由于声音从胸部反射出来所导致的。这种反射不仅增强了该方向上的声音强度,还可能对频谱产生一定的影响,尤其是在低频部分。
距离与方向
由于并非所有麦克风都放置在距离讲话者1米的地方,因此了解当我们靠近声源时会发生什么是很有趣的。
下图显示了在给定方向上1米处记录的语音频谱的偏差。角度(+45度、0度和-45度)在垂直平面内。这些结果是10个谈话者的平均值。
三个图中的每条线分别显示了80厘米、40厘米、20厘米和10厘米处的偏差。
如果在改变方向和距离时频谱没有变化,所有曲线都将是直线,但随着我们离谈话者越来越近,偏差会增加。
下图显示了从轴向平面向上45°的测量位置。与这里的偏差是微妙的。而不那么依赖于距离。
下图显示了当我们在轴向平面下方45°的测量位置。身体对声音的反射对的影响是巨大的。
下图显示了在轴向上偏差在一定程度上介于其他两个之间,这意味着语音的频谱随着到麦克风的距离而变化。
(参考: Brixen, Eddy B.: Near field registration of the human voice: Spectral changes due to positions. AES Convention 104, Amsterdam, the Netherlands. Preprint 4728)
研究表明,声音在垂直和水平平面上都表现出明显的指向性,其中高频声音的指向性尤为显著。这意味着在麦克风拾音时,麦克风的位置和方向对语音清晰度至关重要。此外,随着我们与声源的距离变化,语音的频谱也会发生变化,这进一步强调了麦克风放置的重要性。
对于头部和胸部的反射,研究同样揭示了它们对语音频谱的显著影响。领夹式麦克风或头戴式麦克风虽然提供了行动自由,但也可能导致记录的频谱与自然感知的频谱存在差异。因此,在选择和放置麦克风时,我们需要考虑这些因素对语音清晰度的影响。
头部和胸部
在广播和现场声音应用中,首选的麦克风通常是领夹式麦克风(胸部佩戴)或头戴式麦克风(头戴),这允许用户有更多的行动自由。人们应该意识到这样一个事实,即将麦克风放置在如此短的距离处会导致记录的频谱不同于在正常收听距离处感知到的自然和中性频谱。这种差异远远不能忽略。
以下是五条曲线,解释了将麦克风放置在身体或头部时语音频谱的变化。所有曲线均基于测量值,平均为10人(见参考文献)。
上曲线(胸部)量化了在胸部采集的语音频谱与在轴上1米处采集的同一个人的语音频谱的不同方式。当将麦克风放在胸部时,关键2-4 kHz范围内的频率会显著降低。
第二条曲线(颈部)显示了麦克风离下巴更近时的偏差。这一立场非常适用于广播,因为如果记者或受访者穿着t恤、运动衫等或外套,这是放置领夹式麦克风的唯一实用方法。在户外使用时,麦克风可以披着毛皮或戴在围巾后面。在任何情况下:辅音频率都会大幅降低。
前额曲线表明,将麦克风放在前额上是对频谱干扰最小的位置。这个位置非常适合舞台和电影,但不适合新闻。
耳朵曲线显示了在这个位置较高频率的逐渐衰减。将麦克风放置在耳朵处可以很方便;然而,它需要补偿以保持语音可懂度。
将麦克风放在脸颊(耳机)时,与大多数其他位置相比,2-4 kHz的范围更好。然而,仍然需要在最高频率下提升。DPA耳机具有内置升降装置。
需要注意的是,与胸部姿势相比,“微笑的角落”(脸颊处)的语音水平高出约10 dB。
从曲线中可以看出,在800Hz附近存在上升的一般趋势,这可以被认为是补偿的。然而,最显著的偏差是导致语音可懂度降低的衰减。这一定要时刻注意!
(参考: Brixen, Eddy B.: Spectral degradation of speech captured by miniature microphones mounted on Persons’ heads and chests. AES Convention no. 100, Copenhagen, Denmark. Preprint 4284.)
麦克风的放置规则
基于上述分析,我们为麦克风的选择和放置制定了以下规则:
人声手持麦克风应位于口腔前方,角度为±30°,并尽量保持轴向对齐。
领夹式/胸部佩戴式麦克风应使用预均衡或后期均衡来补偿在胸部位置处缺失的3-4kHz频率范围。
头戴麦克风相对中性,但可能仍需对高频进行适当补偿。
讲台麦克风应具有指向性,并指向讲话者的嘴部,以减少环境噪音的影响。
在多扬声器环境中,应选择定向麦克风,并确保每个扬声器的麦克风能够将其他扬声器的声音衰减至少10 dB。
结语与展望
至此,关于语言清晰度(可理解性)的深入洞察系列已告一段落。我们希望通过这一系列文章,为大家提供了对语音产生、传播和接收过程中影响语言清晰度的因素的全面理解。
然而,音频技术的探索永无止境。在未来,我们将继续关注音频技术的最新发展,并为大家带来更多关于音频原理、前沿技术及其应用场景的探讨。让我们共同期待音频技术为我们带来的更多可能!
评论comment