DAV首页
数字音视工程网

微信公众号

数字音视工程网

手机DAV

null
null
null
卓华,
招商,
null
null
null
null
null

我的位置:

share

关于语言清晰度(可理解性)的深入洞察(一)

来源:同创音频        编辑:lgh    2024-06-04 09:52:40     加入收藏

在日常交流中,面对面交谈的语音清晰度往往令人感到自然而毫不费力。然而,一旦涉及到扩声,保持这种清晰度就变得颇具挑战性。本文旨在深入探讨语言清晰度(可...

在日常交流中,面对面交谈的语音清晰度往往令人感到自然而毫不费力。然而,一旦涉及到扩声,保持这种清晰度就变得颇具挑战性。本文旨在深入探讨语言清晰度(可理解性)的关键要素,并分享一些实用的技巧,以确保在各种场景下都能维持高质量的语音清晰度。

  核心要点概述

  语言来自口头表达。因此在对语音进行扩声时,您应该始终考虑如何保持语言的清晰度(可理解性)。

  语音的产生:声音是通过声带的振动而产生,音量和音高均可通过声带的控制来变化。声音频谱的过滤则受到咽、口、鼻等腔体的影响。

  录音技巧:改变声音的力度可以改变声音的音量和频谱。甚至声音的音高也会随着发声的力度而变化。例如大喊大叫听起来就明显不同于正常说话。因此在录音时,确保捕捉语音信号的峰值至关重要,因为它们在RMS或平均音量之上可能显著升高。同样对于出现在500hz以上的频率范围内辅音(k, p, s, t等),特别是位于2kHz - 4kHz频率范围内的辅音,对于非声调语言的清晰度至关重要。

  距离与位置:距离说话者大约一米时,语音的清晰度和自然度通常达到最佳,我们会觉得他的声音是自然的,站在人的旁边或后面会降低自然度和清晰度(可理解性)。不同的位置(如侧面或后方)可能会影响声音的感知。实际上,除了我们用耳朵或麦克风靠近发言人的时候,几乎在任何其他位置都能听到清晰的声音。

  音色与频率:头部、胸部或身体的不同位置会赋予声音独特的音色。例如,胸部位置的语音频谱可能缺乏2kHz-4kHz范围内的关键频率,这会导致语音清晰度降低。如果麦克风不能补偿这一点,你应该用均衡器进行校正。

 

  语音作为声源

  语音不仅是交流的工具,更是一种复杂的声学信号。虽然语言本身具有普遍性,但每个人的声音特征和音质都是独一无二的。了解这些差异对于确保录音和扩声中的清晰度至关重要。

  声级

  因为人们在发声时用力的程度不同,从轻声低语到大声喊叫,语音的音量变化范围极大,所以很难给语音音量指定一个固定的数字。下表中的值表示成年人的平均A加权语音音量。值得注意的是,当语音音量对应于1米距离处的正常语音水平时,理解语音的能力是最佳的。换言之,大约55-65 dB的声压级为20μPa。

(在这种情况下,参考是可听到的最弱声压级)

作为收听/录音距离的函数的平均语音水平。正常讲话和叫喊之间有将近20分贝的差异。

  峰值

  同时要注意峰值因素——即峰值电平与RMS电平之间的比率,这对于避免录音或拾音的失真至关重要。

  上表中显示的每个电平都是平均RMS电平,而不是峰值电平。通常,峰值比RMS电平高出20-23dB。峰值电平和RMS电平之间的比率称为峰值因子。当在电声系统中记录或再现语音时,该因素是一个重要参数。另请注意:在嘴唇处测量的大声歌唱可以达到130 dB (参考20μPa RMS)的电平,峰值水平超过150 dB(参考20μPa RMS)。

  男声,正常讲话(时长18秒)。平均RMS:-21.5 dBFS,峰值:-0.5 dBFS。波峰系数11(21 dB)。红色虚线表示RMS电平。

  实用建议

  选择合适的麦克风:针对特定应用场景选择合适的麦克风,确保捕捉高音频细节。

  善用均衡器:针对录音环境或麦克风位置导致的频率缺失,使用均衡器进行补偿。

  优化录音环境:尽量避免背景噪音和回声,在空间内使用吸声材料或采取其他声学处理措施。

  注意距离与位置:保持与发言者的适当距离和位置,最大化语音的清晰度和自然度。

  遵循这些建议,深入了解语音产生的原理,您将在各种场合下轻松确保高质量的语音清晰度。让我们期待下一期,继续探索语言清晰度的更多奥秘!

  本文转载自DSP同创音频微信公众号

免责声明:本文来源于同创音频,本文仅代表作者个人观点,本站不作任何保证和承诺,若有任何疑问,请与本文作者联系或有侵权行为联系本站删除。
扫一扫关注数字音视工程网公众号

相关阅读related

评论comment

 
验证码:
您还能输入500