华平Full HD视频会议系统真正的高清享受 ————高清技术已成为音视频行业的趋势性技术
来源:中国数字音视网 作者:Ann 编辑:数字音视工程 2009-11-25 00:00:00 加入收藏
前言
随着视讯技术的日趋成熟,更多的行业用户开始接受并使用这一技术。传统视频通讯在解析度、色彩还原度等方面都和真实场景有较大的差距,经常受编解码设备、编解码效率、链路动态适应能力等诸多因素影响而导致对真实场景的还原失真;在音频方面,传统的50Hz-7KHz只能感受到较窄的音频宽度,无法实现对现场环境和声音特征进行有效还原。综上所述,传统的音视频技术根本无法满足高级用户对高清视讯的特殊需求,并一直制约着视讯行业的发展。为了满足远程医疗、远程手术、远程维修等特殊行业用户对高清晰视频应用的需要,新一代高清晰视频通讯技术及产品应运而生。
视频编解码技术
在视频会议应用中,视频质量和网络带宽的占用是成正比的,通常情况下视频流占用的带宽越高则视频质量也越高,同理对视频效果的要求越高,需要的网络带宽也越大,而解决这一矛盾的钥匙就是视频编解码技术。评判一种视频编解码技术的优劣通常有两种方式:一是在相同的带宽条件下,比较哪种视频质量更好;二是在相同的视频质量条件下,比较哪种占用的网络带宽更少。实践证明,基于H.264——高清编解码技术能够将二者的优点集于一身,在占用网络带宽较小的情况下实现视频质量的最优化。
在高清编码/解码技术产生之前,视频会议数据是基于通用交换格式 (CIF) 进行编码的。国际电信联盟-电信标准部(ITU-T)制定了视频标准,称为H.261和 H.263。H.261 标准只定义了 QCIF 和 CIF 格式。四分之一 CIF (QCIF) 格式只被用于最低数据率(64 千位/ 秒及更低)的会议,目前已经很少使用。自从H.263 标准发布以来,使用“全分辨率”(定义为 16CIF)的格式(4CIF 和 16CIF)逐步被采用。由于采用此类标准时,受到计算和宽带的限制,所以用于全动态视频会议的通用分辨率仍然是 CIF 到 4CIF。为了减小整个视频文件的大小,文件可以更为经济地通过容量更小的网络连接(更低的数据率/ 宽带)进行传输,有效的利用网络带宽,使网络资源更加经济有效。ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准(H.264/MPEG-4 AVC(H.264))可通过比较低的数据传输率提供高质量画面,使同等图象质量下的压缩效率比以前的标准提高了2倍以上。因此,H.264被普遍认为是最有影响力的行业标准,已成为HD-DVD(高清DVD)以及广播、有线、视频会议和消费电子产品的强制标准。
H.264是继MPEG4之后的新一代数字视频压缩格式,它既保留了以往压缩技术的精华又具有其他压缩技术无法比拟的许多优点:
1.低码流(Low Bit Rate):和MPEG2和MPEG4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量的花费。
2.高质量的图像:H.264能提供连续、流畅的高质量图像(DVD质量)。
3.容错能力强:H.264解决了在网络环境不稳定时,容易发生丢包等错误问题。
4.网络适应性强:H.264提供了网络适应层(Network Adaptation Layer), 使其文件能轻松地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。
数字电视的格式标准
目前,我们使用的电视均采用的是NTSC或PAL制式的标准清晰度 (SD) 模拟电视。NTSC制式(用于北美及其他一些地区)水平解像度为525线,每秒30帧画面;PAL制式(用于世界上的其他地区)为625线,每秒24帧画面。标清格式采用的是隔行扫描模式,先扫描静止画面的奇数行,然后扫描同一幅图像信息的偶数行,使得两幅画面会同时显示在显示器上,也称为每秒50/60场。该技术被开发用于节约传输宽带(特定的网络连接的数据率容量),其分辨率被称为480i,可提供由240线不同信息组成的画面,用于家用标清的带宽需求为45-90Mbps。对于小型视频显示器(小于27英寸),标清电视看上去相当清晰、流畅。但是,如果屏幕超过 27 英寸,480i格式的图像质量会有明显的下降,甚至会看到锯齿线、轮廓模糊、褪色、视觉噪声和间断的动作。
高清晰度格式则采用逐行扫描模式,将480线图像信息行合并为一个帧,然后自动修正画面质量,减少了大屏幕上的锯齿画面并使画面动作变得更为流畅。高清格式提供的图像信息量比任何标清格式都要多。如果将屏幕分辨率转换为像素,可以清楚地看到高清格式比480i格式高出至少4倍以上的图像信息量,图像分辨率达到1080P、1080i或者 720p,这就是我们所说的HDTV,即High Definision TV。HDTV有三种显示格式,分别是:720P(1280×720P,逐行),1080 i(1920×1080i,隔行),1080P(1920×1080i,逐行)。
在图像的幅面显示方面,传统视频通讯系统多数采用4:3显示方式,而高清晰视频通讯在视频格式幅型采用更为符合人眼观赏习惯的16:9的显示方式,因为屏幕显示区域在垂直解像度(线数)相同的情况下,采用16:9显示方式可视面积比4:3显示方式的可视面积要增加20%左右,所以单帧画面可容纳更多的视频信息,视频通讯中用户可以获得更大角度的视频图像。
音频技术标准
视频通讯过程包含视频和音频的实时双向的完整通讯过程。而我们往往在努力获得高清晰视频图像时,却经常忽略更为重要的音频通讯过程。如果我们在观看高清晰视频图像时不能得到一个更清晰、连续的音频效果,通讯过程则失去意义。传统的视频会议系统中使用的音频编解码压缩标准是为了保持传输时的低带宽占用和较高的编解码效率,所以造成音频技术发展极其缓慢。为此,传统的视频会议系统将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,所能提供的音频清晰度和还原性都有很大的衰减,同用于存储和回放非实时压缩协议的标准(例如OGG、MP3)等相比,音频的保真度非常低,使其在某种程度上对现场声音的还原无法达到要求。目前传统视频通讯过程中主要采用的G.711、G.722、G.722.1、G.728等音频标准,音频宽度仅有50Hz-7KHz单声道,而人耳所能感知的自然界的频响能力可以达到20Hz-20KHz。因此,在对现场环境音的还原过程中,过多的音频信息丢失造成了无法真实地表现现场情况,需要有一种相辅助的音频处理方式才能解决此问题,使整个高清晰通讯过程更去近于完美。
目前国际上在音频处理技术上的标准较多,在下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频标准,其原则是:使音频频响范围可以达到22KHz,覆盖人耳听觉的全部范围,甚至在高频方面还有所超越,能够使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通讯的声音有更强的临近感,达到CD级音质,同时在对链路带宽的适应和编解码效率上达到最佳。下表列出AAC的9种规格。
标准 | 规 格 |
MPEG-2 AAC MAIN | 主标准,对音频处理上,缺少增益控制 |
MPEG-2 AAC LC | 使用了TNS,缺少增益和预测,提高编码效率 |
MPEG-2AAC SSR | 可变取样方式 |
MPEG-4 AAC LC | 低复杂度编码方式 |
MPEG-4 AAC MAIN | 主标准 |
MPEG-4 AAC SSR | 可变取样方式 |
MPEG-4 AAC LD | 低延迟编码方式 |
MPEG-4 AAC HE | 高效率编码方式 |
MPEG-4 AAC LTP | 长时预测规格 |
综上所述,我们在对宽频音频的支持上可以选择MPEG-1 Layer 2或AAC系列标准,在上述列表中可以看出有9种AAC格式可供选择,每种格式均有各自特点。在下一代高清晰视频通讯应用领域中为用户提供CD级的宽频音频是我们追求的方向。
目前在国内的视频会议市场上,真正做到高清视频的公司屈指可数。华平公司的Full HD全高清视频会议系统能够实现最逼真动人的协作沟通:高清视频(1080P)、高清语音、高清的内容共享等等。让用户可以轻松享受高清技术带来的如临现场的会议效果。
总结:高清在音频和视频方面都有着非凡的表现,让用户可以轻松享受影院级的视听震撼。高清技术已成为视频行业的趋势性技术,它的全面普及和应用仍在加速。
评论comment