探寻数字声学空间处理新路径—深度探索音王集团旗下品牌(CADAC、录音大师、音王)自适应声场处理器技术
来源:音王 编辑:站台丶 2023-09-13 15:34:51 加入收藏
深度探索前,关于声音的话题:
声学是研究声音的学问,也是复杂的较难掌握的科学。声学的终极目标是要解决声音整个传播链路的一致性、完整性。而我们本篇所要探索的只是其很小的一个领域,牵扯到声场形成的某几个方面。
每天我们都要听到各种声音,由于声音不可视,需要专业的软件进行复杂的测量,而且测量指标受声学环境影响极大,在不同测量的环境中得到的结果大相径庭,解决不同的声学环境问题需要不同的信号处理工具,目前更多的还是基于复杂的均衡器的声场调试,这又会带来新的相位问题,最终用户只能接受主观听觉的评价,由此声学在这块彻底失去了标准。
人类是靠双耳来分辨声音的,声音到达双耳的时间快慢,是人的大脑从小到大逐渐适应了这种时间信息的分析,大脑可以根据一个声音到达双耳的细微时间差别来分辨发声体的位置,也可以根据反射时间不一样来判定空间的大小和属性。大多数专业的音频工程师把注意力放在频率响应上,因为频率响应的显示相对直观,而相位图和群延时图示相对来说不容易提供听感直观显示,音频工程师忽略了人类对于声音最为训练有素的本能。
声学还音的过程,是依靠扬声器在特定空间中的播放实现聆听的,在这个过程中,音源播放,通过功率放大器到分频器(大多数喇叭无法表达出20-20K人类听觉范围),推到扬声器震动空气,到达特定声场的听众耳朵里,在这个复杂的换能过程中,分频器、房间的结构,听众的位置都会大大的影响不同频率的声音到达人耳的时间,这种时间关系在声学中表达为相位关系。而这种相位关系在主观听觉中是一个至关重要的声学指标,不同频率在时间关系上的正向叠加和反向衰减会带来频率响应的不同变化,特别是在20-200Hz时,由于波长相对较长,这种叠加和衰减更加容易发生,会发生房间驻波和低音区无力或多只低音音箱声能抵消等现象,因此我们希望高低音同时到达我们的耳朵是一个理想值,这种理想值靠调整单只音箱的延迟时间是事倍功半的。我们需要从相位的理念上去纠正来还原声音的本形。
在声场处理和控制领域,目前行业发展趋势:
随着软硬件技术的螺旋迭代式发展,我们对于声场这种瞬变、干涉极为复杂,看似难以把控的声场能量有序分布,也有越来越多的调控手段。从初级的EQ模式到高级的自适应模式,也呈现出明显的迭代进化特征:
首先是数字化和网络化:随着数字技术和网络技术的不断发展,声场处理器和控制设备也越来越数字化和网络化。数字信号处理技术的应用,使得声场处理器可以更加精细地控制声场构建的各种参数,网络技术的应用,使得多个声场处理器可以实现联网控制和协同工作,提高声音处理的效率和精度。
其次是智能化和自适应性:智能化和自适应性是声场处理器和控制设备的发展方向之一。智能化技术的应用,使得声场处理器可以自动采集不同的声音场景参数,并根据场景特点自适应地调整声场参数,极大提高声音处理的效率和质量。这一点在声场处理成为各类应用场景所必需的一环,大量需求爆发式增长当下,几分钟搞定一个声场的调试,极具现实意义。
▊技术发展趋势
——突破性的思维路径,解决空间响应均衡难题
通过应用先进的数字信号处理技术来设计基于房间响应的一个或多个测量值的均衡器,从而改善房间中的声音重现。在过去的40年中,各国的声学研究者对这个主题进行了深入的研究,从而产生了许多有效的技术从各个方面来解决房间问题。
当一个或多个扬声器再现声音时,收听环境会改变所需听觉错觉的感觉。在某种程度上,这可以看作是积极的,因为增加了空间和深度,但是环境和声音再现系统也会引入不希望的“伪影”。聆听环境中的过多反射或共振可能会导致听觉错觉的不良变化。非理想的再现系统甚至可能向原始声音添加一些伪像(例如,频段过多增益或衰减,非线性失真)。
我们的研发人员从理论上研究空间响应均衡方法,并在实践中推出“APC-acoustic phase calibration” 的方法来改善声音再现的质量,这与空间环境和再现系统的不利影响形成了鲜明对比。在该系统中,测试得到声音再现系统到收听者的路径的空间传递函数(Room Tansfer Function), 利用以多种方式实现的适当设计的均衡器来均衡。基本思想是使用麦克风测量空间脉冲响应(RIR),然后通过其反相获得均衡器参数。在过去40年中声学工程师们开发了各种各样的技术。在不同的技术文章中使用了许多不同的名称,例如“空间均衡”,“空间校正”,“房间补偿”,“房间反转”,“房间去混响”,“去混响”,“减少混响”等。本文中,我们应用“APC-acoustic phase calibration” 来解析RTF测量设计均衡器的大多数技术。
空间反向滤波器设计有多种替代方案的多维性。也可以考虑非参数方法(例如最小二乘法或频率响应的直接反算)来进行FIR的反算,例如自回归移动平均值(ARMA)建模的参数方法或低频时间衰减控制方法。但方法的分类之外,我们也可以根据滤波器应用来分类,如APC分为最小相位或线性相位。前者仅针对RTF幅度的均衡,而后者除幅度处理外,也作用于相位RTF分量。
大多数著名的音频厂商由于DSP技术实现的原因,仍然从物理声学上对低音相位进行控制,对用户在特定的房间中的校准,仍然采用关注频域的方式,使用IIR滤波器(也就是我们经常使用的参数均衡器)进行房间频率补偿,这会带来两种恶果,在补偿频率上造成更大的相位畸变,在由于房间造成的频率提升(波峰)和衰减(波谷)进行反向操作,波峰的反向衰减对于特定位置非常敏感,移动位置则效果相差很大,而对波谷的提升会极大的伤害系统的动态范围,造成很大的谐波失真。尽管这些逆滤波器系数是自动计算的,极大的保障了频响曲线的平坦,但相位曲线却更加恶化。
——并行运算,实时的感知并精密处理复杂音频信号中的最细微波动
为此,我们建立了一套基于声学空间测量结果的反馈相位修正系统,对各频率产生的不同相位畸变进行最小相位的修正,对于音箱从制造设计,空间中播放产生的诸多相位叠加或抵消进行数据分析,并根据数据分析,产生独特的FIR滤波器系数对系统进行整体的修正。这套系统摒弃了基于串行计算的高速DSP,而采用并行式的FPGA处理系统,我们的FIR滤波器实时的对各频段进行超过2万阶的实时处理,而花费的时间只有DSP的百分之一。这样我们保证了我们在处理中不会造成新的相位畸变。
自适应声场处理器
自适应声场处理器是一款高端的自适应声场处理器,它采用了高速并行处理的全FPGA技术平台和先进的算法,能够自动调整声场能量分布,使音乐表现更加层次分明、通透和真实。
它是新一代声场校准处理工具,能够通过极简的操作,迅速校准声场响应情况,减少空间环境对声场的各种负面影响,使各类声系统在苛刻的环境下均能发挥其最优性能。
一经问世便获得业内高度关注和广泛认可,其优异性能离不开突破性的创新路径和成果。
▊全球首创全FPGA架构空间声场处理器
全球首台全FPGA架构的全FIR滤波器声学空间相位修正系统。通过测量话筒对空间进行单点或多点的声学测量取样后,针对音箱在空间中播放由于声波反射而产生的各种相位叠加或抵消进行数据分析,并生成独特的FIR滤波器系数,然后对声音相位进整体的修正。最大的特点是采用超大规模并行算法的高速FPGA处理平台,对FIR滤波器对各频率相位进行高达8196阶的处理,而花费的时间仅在微秒级,从而保证了在数字运算处理中不会造成新的相位畸变。
▊每声道4096阶逐点精准全FIR修正
人们在听音区域听到声音是“直达声”和“反射声”的集合, 但由于反射声的不总是和直达声同一时间到到你的耳朵,因此直达声和各种反射声之间就会由于时间差而造成声相位干涉,同相的声音会产生叠加,相位相反的声音会产生抵消,这些叠加和抵消就会把原来平直的频响特性扭曲。
通过特别的声学算法,对话筒取样回来的声相位数据进行运算分析,并由每声409点的最小相位FIR滤波器(Minmum phase FIR filters),对 20-20KHz频段的相位和频率特性进行精确的修正,从而确保听音区域可以获得正确平直的频响和相位特性,提高直达声的清晰度,将空间反射声的干扰减到最低,为你摆脱不可控的房间声学缺陷干扰,还你一个准确、真实、清晰有力的低频,处理后的立体声音场定位更加精准,舞台空间感更加宽阔、深邃。
▊RealTime — 低至0.25毫秒
由于传统DSP芯片串行算法架构对于高阶数FIR相位修正处理有巨大的延迟, 多数基于DSP架构的音频处理器仍然采用IIR+低阶数FIR滤波器的处理方式,特别是对于100Hz以下低频段的处理,相位畸变仍然十分巨大。摒弃DSP架构,采用基于并行算法的高速FPGA平台,8千多个逻辑门同时执行FIR处理,相当于512个DSP芯片同时工作,处理速度只有传统DSP音频处理器的百分之一,避免了在处理过程中由于高延迟而带来新的时钟失真和相位畸变。
其主要延迟来自AD/DA环节,FPGA处理只有0.07ms,加上系统其它硬件延迟,总延迟只有0.25ms, 100Hz以下相位延迟不超过35°。
▊极简操作
传统的声学空间问题的解决手段相当的复杂,系统工程师需要运用不同的测量和处理工具来解决不同的问题,例如,房间中多个超重低音的摆放,通过多次测量,调整摆放位置,设置不同的延时时间,使重低音能够同相播放,同时又要顾及重低音与全频的时间关系,这样复杂的设置,往往顾此失彼,无法得到相对正确的结果。同时房间和喇叭需要顾及的不只是低音,在中低音区发生的房间驻波,中音区的分频相位失真,高频在房间中的早期反射,使系统工程师身心疲惫,在花费大量的时间调试以后,只能把一个千疮百孔的音响系统交给调音师,调音师只能根据有缺陷的系统在调音中反复解决系统中出现的问题,根本没有时间进行音乐的平衡。
当其通过网线接入路由器后,笔记本电脑即可通过无线局域网与其进行无线控制,软件无需复杂的安装程序,直接点击开启,简洁的单页操作界面,用户只需摆放好测量话筒,在软件界面上点击几个简单的步骤即可完成测量操作和优化处理,没有复杂的设置过程,也无需额外的专业测量设备辅助和接受专业知识的培训,普通用家也可以熟练掌握,让专业的声学校准变得更加简单和智能。
其独特算法只需要对房间中一个点或大型空间中的多个点进行话筒测量,每个测量点的时间只需要三秒钟,对于空间中的噪声有极大的容忍度,然后算法会花十秒钟来发现系统中存在的相位问题,自动将问题的处理参数发送给FPGA,这系列过程中,无需人的干预,只需要支上话筒,按下测量键就可以了。调音师在10秒钟后就能够得到一个标准的声学空间,在这个空间里,没有多个重低音音箱的抵消造成的低音不足,也不会低频共振,没有烦人的反馈啸叫。因为我们的智能算法已经对声场了如指掌,调音师甚至可以通过我们的频响曲线设计来设计音乐频响的整体风格。
▊Hi-END级的声音表现
它是一台精密的声场校正的“仪器”,因此对它的性能要求是苛刻的。得益于我们长期研究Hi-END模拟音频设备的丰富经验,在其数字处理技术上, 我们比传统DSP处理方式更注重输出输入的延退特性,这个特性是以时间相位度数(phase degree)为准而非传统的时间ms(毫秒), 我们通过采样精度、采样频率、相位精度这三个维度的数字标准来再现真实的声音本质,在算法和延退之间不做妥协。
D/A模拟输出部分采用全平衡线路,输出声道均采用总谐波失真低至0.00003%以下的音频专用顶级发烧运放,通过反复对比测试,选定对声音产生关键影响的元器件,并量身定制了低噪音高精度,模拟、数字独立的电源供应系统,极致手段打造发烧级的声音,绝不向任何影响音质的因素妥协。
九大优势:
快捷——测量操作极致简便,分秒内解决最苛刻声场难题
精确——高达4096 Tap逐点校正FIR
准确——一切基于高精度测量话筒与算法,避免主观因素的偏差和干扰
实时——高性能FPGA并行运算带来近乎零的延时
Hi END——极致声音表现,近似模拟的音质
世界领先的脉冲校正技术,提升音箱的聚能特性
不牺牲音箱的相位响应,实现精确灵活的音箱频响曲线设计
全球独步的高阶FIR滤波器在零延时的状况下提升低频性能,使低音更紧致
大幅提升系统的直达反射声比率,实现现场混响声的精确控制
自适应声场处理器的诞生和应用,将使原有的音频系统可获得最佳的声场效果,发挥国际上行业内其他音响处理器所无法替代的声场处理能力,是一个名副其实的人工智能调音师。为保证音频系统工程的优质和声场控制能稳定发挥着一个调音师的现场守护与自动运维功能,该产品应用到现有的巨大存量音频工程系统改造,必将有效的改变原有系统的音响效果,提高观众的优良听感,也由此给终端用户带来重新的、前所未有的最佳音响效果。因此,我们有理由相信,这个技术的发明与产品在工程设计的应用,将成为广大音频工作者的最佳伙伴和随身工具,成为现在和将来所有音频系统工程设计中的必有之选。
系统拓扑图
各类场景完成调试时间 | |||
场景 | 时间 | 测试点位数 | 音箱数量 |
主题公园 | 30分钟 | 16 | 40-60 |
演出租赁 | 15分钟 | 10-16 | 20-60 |
体育场馆 | 30分钟 | 16 | 40-60 |
大剧院 | 20分钟 | 16 | 40-60 |
LIVE HOUSE | 15分钟 | 10-14 | 20-40 |
会议室 | 15分钟 | 5-8 | 6-30 |
多功能厅 | 10分钟 | 8-10 | 10-20 |
电影院 | 10分钟 | 10-14 | 20-40 |
电视台演播厅 | 30分钟 | 10-14 | 10-30 |
适用于主题公园、演出租赁、体育场馆、大剧院、LIVE HOUSE、会议厅、多功能厅、电影院、电视台演播室等场所使用。
主题公园 演出租赁 大剧院
会议厅 多功能厅 电视台演播室
音王集团旗下品牌(CADAC、录音大师、音王)自适应声场处理器具备世界先进的脉冲校正技术和高阶FIR滤波器,可以提升声场能量分布均衡、低频性能和直达反射声比率,从而实现音频信号处理的精确控制。快捷、精确、准确的测量和精准算法可以帮助用户快速解决最苛刻的声场难题,提高操作效率和准确度。它对于需要实现声场精确调试,尤其是快速调试的各类PA应用场景,如流动演出、剧场剧院、录音棚等是一个必备利器。它就像一个智能AI调音师,可以取代大部分调音师的基础声场调试工作,而让调音师真正的沉浸于声音的艺术创作过程,因此市场潜力巨大。
评论comment