DAV首页
数字音视工程网

微信公众号

数字音视工程网

手机DAV

null
null
null
卓华,
招商,
null
null
null
null
null

我的位置:

share

让智慧显示设备“听”得更清楚,视美泰推出基于RK3288及RK3399系列人工智能主板的麦克阵列解决方案

来源:视美泰        编辑:lsy631994092    2020-01-06 11:06:06     加入收藏

智慧会议一体机在实际推进过程中存在不少难点,语音识别需要清晰的识别出人声,而嘈杂环境使得人声的提取变得非常困难。为了优化智慧显示设备语音识别难题,视美泰推出了基于RK3288及RK3399系列人工智能主板的2MIC和4/6MIC解决方案,大幅提升智慧显示设备在复杂使用环境下的语音识别准确度。

  随着智能语音技术日渐成熟,商业化应用成为可能,智慧显示设备成为智能语音落地的重要载体,基于智能语音实现可以实现智慧显示设备更智能化的人机交互,已在各种高端自助服务终端、服务机器人、电梯可视化对讲、智慧会议一体机等得到应用。而在实际推进过程中,仍存在不少难点,语音识别需要清晰的识别出人声,包括将人声和环境声进行分离,将人声和人声进行分离,而嘈杂环境使得人声的提取变得非常困难,尤其是针对远场语音交互,噪音的问题更加突出。

图片

  为了优化智慧显示设备语音识别难题,视美泰推出了基于RK3288及RK3399系列人工智能主板的2MIC和4/6MIC解决方案,通过USB接口连接主板和麦克阵列板,可大幅提升智慧显示设备在复杂使用环境下的语音识别准确度。

  SMDT_USB 6MIC 六麦克风阵列解决方案

图片

  该方案适用于可搭载70mm直径的环形六麦克风阵列的智能语音产品,可实现5米内远场拾音、噪声抑制、语音唤醒和回声消除等功能,为语音转写、识别或交互提供高质量的音频信号。

  方案优势:

  1、远场拾音

  在家居环境下,拾音距离可以达到5米。

  2、噪音抑制

  利用六麦克阵列的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,实现噪声抑制。

  3、语音唤醒

  支持自定义中文或英文唤醒词,充分满足个性化唤醒需求。

  4、回声消除

  方案支持2路模拟回声参考信号的接入,通过算法处理实现回声消除。最高可支持在80dB的声源播放强度下,精准拾音。

  5、声源定位

  精准定位声源所处角度,支持360°声源定位功能,准确度±10 度;

  6、支持科大讯飞语音语义识别算法

  该方案可以支持科大讯飞语音语义识别算法,识别率高达98%。

  麦克搭载方式

  请按环形、水平摆放,麦克风之间构成的环形的直径为70mm:

图片

  SMDT_USB 4MIC 四麦克风阵列解决方案

图片

  该方案适用于可搭载105mm间距四麦克风阵列的智能语音产品,可实现5米内远场拾音、噪声抑制、语音唤醒和回声消除等功能,为语音转写、识别或交互提供高质量的音频信号。

  方案优势:

  1、远场拾音

  在家居环境下,拾音距离可以达到5米。

  2、噪音抑制

  利用四麦克阵列的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,实现噪声抑制。

  3、语音唤醒

  支持自定义中文或英文唤醒词,充分满足个性化唤醒需求。

  4、回声消除

  方案支持2路模拟回声参考信号的接入,通过算法处理实现回声消除。最高可支持在80dB的声源播放强度下,精准拾音。

  5、声源定位

  精准定位声源所处角度,支持180°声源定位功能,准确度±10 度;

  6、支持科大讯飞语音语义识别算法

  该方案可以支持科大讯飞语音语义识别算法,识别率高达98%。

  麦克搭载方式

  麦克风请按直线等距水平摆放,相邻麦克风之间的间距为35mm:

图片

  SMDT_USB 2MIC 双麦克风阵列解决方案

图片

  该方案适用于可搭载20mm~120mm间距二麦克风阵列的智能语音产品,可实现5米内远场拾音、噪声抑制、语音唤醒和回声消除等功能,为语音转写、识别或交互提供高质量的音频信号。

  方案优势:

  1、远场拾音

  在家居环境下,拾音距离可以达到5米。

  2、噪音抑制

  利用双麦克阵列的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,实现噪声抑制。

  3、语音唤醒

  支持自定义中文或英文唤醒词,充分满足个性化唤醒需求。

  4、回声消除

  回声指智能硬件设备扬声器播放的声音又被设备上的麦克风拾取,会形成对设备拾取声源信号的干扰,方案可支持2路模拟回声参考信号的接入,通过算法处理实现回声消除。最高可支持在 80dB 的声源播放强度下,精准拾音。

  5、声源定位

  精准定位声源所处角度,180°声源定位功能,准确度±15 度;

  6、支持科大讯飞语音语义识别算法

  该方案可以支持科大讯飞语音语义识别算法,识别率高达98%。

  麦克搭载方式

  麦克风请按直线摆放,间距可在20mm至80mm之间调整:

图片

  典型应用

  该方案可广泛应用于各种智慧显示设备,包括服务机器人、电梯可视化对讲、门禁对讲、会议等场景,为设备提供更好地语音语义识别服务,实现更好地人机交互。

  ◆ 服务机器人◆

  已应用于医院导诊咨询服务机器人、商场导航机器人、政务咨询服务机器人等。

图片

  ◆ 门禁对讲◆

  主要应用于小区、写字楼等,让室内室外沟通更顺畅。

图片

  ◆ 智慧会议◆

  该方案可应用于会议、教育、培训等场景,带来更好地沟通体验。

图片

  ◆ 智慧电梯◆

  方案可更好地支持智慧电梯数字标牌的一键报警和可视化对讲功能。

图片

免责声明:本文来源于视美泰,本文仅代表作者个人观点,本站不作任何保证和承诺,若有任何疑问,请与本文作者联系或有侵权行为联系本站删除。
扫一扫关注数字音视工程网公众号

相关阅读related

评论comment

 
验证码:
您还能输入500