SRS技术

  SRS是世界著名的一系列音频专利技术的总称。SRS全称Sound Retrieval System,其含义为声还原系统。
  SRS音频技术的精髓是基于对人耳感知声信号中空间信息的原理和机制,对声信号传输过程中(包括压缩和解码)损失的空间信息,进行提取并还原,为听众重现真实的环绕立体声感,如同置身于现场的三维声场中,被称为“看得见”的声音。
  不仅如此,SRS技术还将人的耳道效应纳入整个听觉系统,根据人类的感知模型来动态处理音频信号,实现了既超越终端扬声器件物理极限而又真实自然的效果体验。
  其具有代表性的技术SRS TruSurround XT、SRS TruSurround HD、SRS WOW、SRS WOW HD和SRS Circle Surround Headphone等被广泛应用于平板电视、音响、媒体播放器、个人电脑和移动电话等领域。
  SRS 3D工作原理
  一、SRS 3D立体声处理
  SRS® 3D处理能还原声音在录制和回放过程中丢失的空间信息。它的处理是利用人类听觉系统特性的,因为只要人是用耳朵来听声音,那么人耳的声音传递特性就是整个声音传递系统中必定经过的一部分。与此同时,SRS 3D系统一方面避免了相位敏感频段负面的额外堆积,另一方面,它在很宽的范围内都有效,因此听众不再被限制在两个扬声器的中轴位置上。
  在立体声信号中,前沿声在左右声道(L、R)中提供了相等的信号能量,从而形成了一个“和”信号,即L+R信号。与此相反,包括反射声和边沿声在内的环境噪声会生成一个复杂的声场,它在左右声道内的分布是不均衡的,形成一个“差”信号,即L-R信号。虽然这两种信号从听觉上讲一般只是“一个”复合信号,但是我们能把它们分离出来进行单独处理,然后再混合成新的复合信号,经过处理后的这一复合信号将包括立体声录音过程无法提供的空间信息。由于提供方向性的信息多数包含在差信号中,它们可以经过处理后把蕴含的方向信息还原到最原始的状态。经处理的差信号还可以经过幅度加强,从而能进一步提高声像的宽度。
  L和R两路立体声信号可以分解为和信号(L+R)和差信号(L-R)的组合:
  L = 1/2(L+R) + 1/2(L-R)
  R = 1/2(L+R) + 1/2(R-L)
  其中,R-L是L-R的反相信号。
  在对原始的立体声信号进行处理后,最终的SRS输出是这样的:
  SRSL = K0L + K1 (L+R) + k2(L-R)p
  SRSR = K0R + K1(L+R) + K2(R-L)p
  其中:
  K0是L和R的直通增益参数;
  K1是L+R增益参数,又称为中置增益参数;
  K2是L-R增益参数,又称为空间感增益参数;
  图3是一个校正传递函数的曲线,它可以用来正确地回放出由听者正前方的发声器(如喇叭)发出但心理声源位于听众侧面的声音。
  图3:使由听者正面音源发出声音的心理声源位置位于90度侧面的校正传递函数
  SRS校正曲线是以图3中的校正传递函数为基础,并且对其他的要素进行了补偿,如耳道共振和立体低音补偿等。
  SRS 3D的益处
  大部分差信号中包含有丰富的中频信息,但它们不能进行无差别的增强处理,这是因为人耳对中频有更高的敏感度,会使我们总是能感觉到更强的中频声。为了不让经过处理后的信号由于中频过强而变得粗糙而刺耳,这部分声音的回放强度必须受到限制,而围绕这部分的高频和低频声音应该得到加强。SRS 3D立体声系统提供的选择性增强有效控制了经处理后信号的频谱内容,营造出一个更宽阔的立体声像感知,同时没有因为对差信号进行无差别增强而带来的刺耳和声像漂移的缺点。
  除了降低声音的粗糙感之外,SRS 3D还提供了传统3D处理技术所不具有的优点。它让听众轻松地突破直达声的掩盖而感知一个表现生动、背景感强烈、现场感真实的声场。可是,在传统录音环境下,能促成临场感的环境声往往被直达声所覆盖,人们从回放过程中将无法感知到与在现场相比同等强度的环境声。一般情况下,环境声往往趋于处在差信号幅度较低的频段中。适当地强化差信号中的这部分频段可以将环境声从各种遮盖中解放出来,从而模拟出真实现场的感受。
  对差信号进行的选择性增强同样提供了更宽的听音区域。差信号中强度较高的部分往往集中在中频,而中频声的波长恰好包括了与人类双耳间头部轮廓相近的长度。SRS选择性强化的成果之一,就是充分地降低了由差信号无差别增强所导致的立体声像漂移的问题,并让最佳听音位不再限制在扬声器的正中位置。
  单声道到立体声的合成
  除了在立体声音源中营造3D声像之外,人们经常需要将单声道音源扩展为声像更宽的格式。
  将单声道音频信号转换为3D声的第一步是合成一个立体声信号。这一工作由SRS 3D单声道系统通过一种利用等相滤波器的技术来完成。原始的单声道信号被加上了两组滤波器,从而生成两路声道输出,它们的相位相差90度,这一相移在100Hz至20kHz频段内维持恒定。根据优先效应,人耳会认为先导信号是直达声,而滞后信号是环境信息。因此,先导信号与标准立体声信号中的和信号L+R相类似,而滞后信号和差信号L-R相类似。
  以此类推,先导信号和滞后信号经过传统的相加与差分技术进行了分解操作,合成了左右立体声信号。然后,这立体声信号被送入SRS 3D处理,如前文所述。因为合成的L、R、L+R和处理后的L-R信号是由一路单声道信号产生的,它们之间的相关性维持不变,因而不再需要对L+R和L-R信号(“中置”和“空间感”)进行用户控制。除左右信号之外,L+R信号同样被输出用作后续处理。
  因为等相滤波器输出信号之间的90度相差仅在100Hz以上频段内维持,而在低于100Hz输出信号的相位则开始会聚。为了在相邻频段内解决低音不均衡和漫射的问题,SRS 3D的立体声左右输出经过了一个二序滤波器的高通滤波,从而让合成出来的立体声主要在约150Hz以上频段。而SRS 3D合成的L+R输出信号则经过低通滤波器后成为一个单声道的低音信号,然后经过相位转换来确保它与高通信号的一致性。最后,经过高通滤波的左右合成信号与经过低通滤波的L+R低音信号在输出端组合在一起,生成最终的左右合成信号输出。这样的处理结果具有高度集中的低音输出。

自定义分类:
音频技术
 
贡献者:
ilhr007
Copyright © 1999-2024 C114 All Rights Reserved | 联系我们 | 沪ICP备12002291号-4