支持单位 - 中国环境产业协会噪声与振动控制专业委员会

SIA Acoustic Tools声学分析软件

文章发布2013年11月19 有1499人次访问

 前言

由于传统技术和工艺设备的限制,声学专家千辛万苦设计并装修出来的电影院、剧场、录音棚等等声学设施,不能用先进的测试设备和手段来测试和检验它们实在是件令人惋惜的事情。尽管过去也有一些国外公司研制和生产了一些过去算是比较先进的测试设备,如瑞士B & K公司,美国Keralk公司等,但无论从技术指标到工艺水平到最后测试分析结果来看,都是十分粗糙和不尽如人意的,它们不但只能测试为数极少的几项简单声学指标,而且这些测试设备还不能对这些指标做任何智能分析。不但如此,其价格也异常昂贵,这不是一般个人能承受得了的。

最近几年,由于计算机及其应用软件的大力开发和发展,声学测试和分析软件就应运而生了。如美国的Sound TechnologySIA等一大批公司,先后编写了多种声学测试及分析软件包。这些软件包各具特色,且测试方法和监控手段各不相同,但是有一个最为鲜明的共同特征是它们比较传统测试和分析方法更为科学、直观和快捷,有大部分声学数据可以进行定量分析和可重复性,设备成本也非常低廉。不仅专业工作者可以使用,即使是那些业余爱好者也容易掌握和熟练地使用。

这里我们为大家介绍一款声学测试和分析软件SIA Acoustic Tools intelligibility。该软件对于业余爱好者来说不需要昂贵设备,一台电脑、一个软件、一只电声指标说过得去的电容话筒,就可以粗略地测试你的录音棚及控制室的各项声学指标了。但对于专业工作者或声学实验室来说,这就不够了。你还需要添置一张很好的全双工操作音频卡(信噪比大于90 dB,失真度优于0.005%),一只专业测试话筒,一台测试级的带幻象电源话筒前置放大器(文章中有具体介绍)。

由于我们目的是想让读者了解该软件的一些基本的但又是非常重要的操作方法和有关软件中的声学术语和名词(我们写的不是软件详细说明书),所以我们只粗略地介绍了一些重要的操作步骤。其实,只要你详细地看懂了文章中的介绍,并亲自操作一下软件,它的测试方法是不难学会的,因为它与其它应用软件毕竟还有许多相通的地方。

Smaart intelligibility组件上 点击intelligibility按钮打开intelligibility对话框。这个窗口几乎显示了在程序中可以计算的全部可懂度和其可懂度模数计算的听音评价结果。可懂度对话窗口是一种浮动窗口,意味着当你在主程序窗口工作时它能始终保持打开状态。当你移动主平面图内的黄色小标记位置时,在可懂度对话窗口你能看见计算结果会得到自动修改(任何地方都适用),照原样反映出数据的变化。在可懂度对话窗口展示的资料可以按ASCII文本文件保存,按窗口右下角保存(Save)按钮就可保存为电子数据表或其他形式的应用文件混响时间和其它有关听觉评价

可懂度对话框下面一部分是专门用于补充听觉评价的控制区和显示区。除STIRSTI%ALCons(如果已经计算)之外,全部都在这儿编成评价表格,这个表格仅仅适用于你选择的频带(宽带,或者通频带)。

Band(频带) - 这个频带选择器与主程序窗口右边的频带选择器按钮具有相同功能,都是在可懂度窗口或数据图示框内选择带宽用的。

Relative T (混响时间T- 也被称为 "T60" "RT60" Relative TT)是测试系统混响时间衰减率的。根据规定,混响时间是对被测试混响衰减按衰减到60分贝以下时的速率规律的时间总量(以秒表示)进行测量。在主程序窗口的平面图上,从LrLn标记的相关位置测定相应的衰减时间。

 Relative Early Decay Time (混响早期衰减时间)- 这是考察它完成衰减的初始阶段速率的表示。该值仅与主程序窗口的平面图上,LrLn标记和所选择的带寛有关。与混响时间所表达的一样,要求对被测试的混响早期衰减按衰减到60分贝以下时的速率规律的时间总量(以秒表示)进行测量。

 Direct to Reverb(直接声与混响声之比)- 直达声平与混响声平表示的是直达声平对于混响衰减斜率混响声能声平的相对差额。这个值(分贝)仅仅是在LdLr标记之间的声平上的差额,不过它是全面评价房间/系统可懂度的重要因素。

Standard T (20), T (30) and Early Decay Time[标准T20),T30)与早期衰减时间]- 对于全带宽和1005000 Hz倍频程或1254000 Hz1/3倍频程带宽,该程序会用工业标准方法自动计算T20T30混响时间和早期衰减时间(Early Decay Tine),并且规定了应有的足够动态范围的数据,即T20最小35 dBT30至少需要45 dBStandard T20),T30)完全依靠数学积分运算,而无须依赖LrLn标记的位置和TEDT之间的关系。只有Ld标记的位置用来确定积分的断点。注意,跟在T后面的数字 "20" "30"只是确定实际测量衰减速率的参照范围(分别为20 dB30 dB)。混响时间和EDT总是按房间/系统衰减到60分贝以下时的速率以秒数来表示的。另外,在这三个数据旁边的框内打勾与否表示你是否要在总平面图上显示T 20, T 30EDT的衰减斜线。

Clarity(透明度) - Clarity一栏中为以毫秒表示所计算出的透明度指数,在这张图表上部的中间一个刻度尺就是它的映像。例如在Clarity方框内键入35,上面那条透明度刻度尺就命名为C35。注意,附加的透明度评价值在All Bands Table(全频带表)中能够表现出来。

STI and RSTI (语言传输指数)- STIRSTI栏展示运行了Calculate STI and RSTI(计算STIRSTI)后的语言传输指数。


计算可懂度和混响时间

声平标记(LdLn

Log (dB)对数刻度尺被选中时,标准时域数据平面图或波形文件数据能量时间曲线(ETC)被显示出来,在平面图(图2)上出现了三个标记,Ld(直达声平),Lr(混响声平),以及Ln(噪声声平)。这三个标记是以时间和音量大小的坐标来计算%ALCONS(辅音音节损失百分率)、Clarity(透明度)指数以及其他有关听觉参数的基础,例如相对混响时间(T)和早期衰减时间(EDT)以及直达声与混响声声平比。%ALCONS计算三个标记的声平位置坐标,这三个标记都是处于2 kHz为中心的倍频程带宽上。注意,为了要显示对%ALCONS的评价,你至少要在2 kHz为中心的倍频程带宽上选中并执行一次。

Clarity (Cn)的计算仅仅使用了LdLn标记的时间位置。

Relative Early Decay Time (EDTR)相对早期衰减时间)是以LdLr之间的相对时间和声平大小的差别为基础计算的。

 Relative Reverberation Time (TR)相对混响时间)是以LrLn之间的相对时间和声平大小的差别为基础计算的。

在计算"标准"混响时间(T 30T 20)以及早期衰减时间(EDT)时,采用了常规的积分运算,仅用了Ld标记的时间位置作为积分的断点。注意standard T30, T20 EDT Intelligibility Graph(可懂度图表)对话框已被激活后在主平面图上的显示情况。

Schroeder的反积分曲线显示出来时,只有Ln标记的时间位置确定了Schroeder积分运算的断点。

注意,STIRSTI计算不依靠任何一个声平位置标记。

声平位置标记

在声波脉冲响应平面图中黄色小方块就是声平位置标记。在这张图表中还展示了自动计算出的"标准"EDT斜线(橙色)、T30混响时间(红色)和Schroeder积分曲线(蓝色)。standard TEDT斜线从Intelligibility 图表对话框中才能激活(前面已介绍)。在大多数情况下,你应该看到Schroeder积分与标准和手动拖拽衰减斜线之间充分合理的相互关系。如果标准的EDTT斜线看起来与实际的数据和Schroeder痕迹不一致的话,你可轻微地推拉Ld标记的时间位置引导它们排成一列。当一个文件被第一次加载或在一个新的频段显示时,可懂度组件将在最高峰值上自动设置Ld标记位置。最高峰值一般地说代表了到来的直达声,并让你差不多在大多数情况下不再需要大量地去调节该标记位置。在任何时候你可以点击左上角第二排"Peak"按钮,让程序去自动寻找并重置最高峰值Ld标记。

LrLn标记位置需要你用手工调整。Lr标记应该放在混响衰减斜线与早期衰减斜线交汇点的位置处。Ln标记应放在混响衰减斜线水平截止点与噪声底值相接近的交汇点。你要在每个倍频或1/3倍频反反复复地做你想要的类似的分析处理。

一旦设置完毕并存储在磁盘上,当你关闭了文件或退出程序后,可懂度组件能够"记住"每个位置的指示标记。标记位置被存储在一个与波形文件同名其扩展名为(.sii)的文件内。不仅LrLn之间在时间和大小上存在差异,而且也意味着相邻的时间间隔存在差异。Slope(倾斜度)(dB/Sec)和相关的混响时间T可在平面图右上角第三排的读出区读出。可以按住Shift键,并按住鼠表右键拖拽,你可以寻找到任意两点间的相同类型的资料。再一次按住Shift键,用"铅笔"点击连线即可抹掉。当这条连线存在时,它的倾斜度和德耳塔数据将在读出区显示出来,然而它与上面被计算出来的LrLn标记的倾斜度没有任何关系。


可懂度图表和全频段表格(The Intelligibility Graph and All Bands Table

确定了声平标记位置后,点击Intelligibility(可懂度)按钮打开可懂度图表对话框。这个窗口显示了混响时间、EDT和在当前带宽与声平标记位置的可懂度评价。

如何采集测试信号?采用双重FFT记录脉冲响应。

为了测量测试系统的脉冲响应,采用双重付里叶变换传输技术。该技术可以使用内部或外部粉红噪声发生器(可用于大多数声学测定的推荐测试信号)或实际上可用任何其它连续信号(如音乐)作为激励信号。

用外部声源的双重FFT测试系统

开始记录过程,打开可懂度组件,并点击位于主程序窗口右上角的记录(REC)键。当Record Impulse(记录脉冲)对话框出现时,点击Dual FFT标签显示双重FFT记录控制器。

设置测量参数

 如果你用内部信号发生器来测量,应把Pink Noise Generator(粉红色噪声发生器)的输出电平设置得较低。在Impulse Output中,你可以键入保存测定结果的路径和文件名,或点击Browse按钮并用Open打开文件对话框去引导目标文件夹并指定文件名。当Averages(平均值)设置得大于1时,测试系统将按指定的FFT构成数去记录、处理并将结果在一起加以平均。每加倍一个Averages(平均值)数量将对所完成测定中的信噪比有3dB的改善,但是,每次测定的时间也会相应加长。一般说来,在噪声较多的环境和/或者当你受到某种限制只能使用较低的声压级来激励房间/测试系统时,你可以使用较高的Averages(平均值)。

采样率(SR)确定完成测定的频率含量。要测定全部音频频谱需要44.1 kHz或更高的采样率。使用较低的采样率将使被分析的音频频率宽度受到采样率频率一半的限制(耐奎斯特采样定义)。

FFT的规模与采样率确定了FFT Time(时间)常量,也被称做"时间窗口"。对于你所选择的FFT的规模和SR值,FFT Time常量就会被自动地计算出来,并显示在FFT Time栏目内。为了得到坚实可靠的脉冲响应测定,FFT时间常量必须要比测试系统的衰减时间要长。一般来说,FFT Time常量从0.7-1.5 S已足够应付小房间到中型房间的测量了。更大的房间有更长的衰减时间,就应有更大的时间常量。但决不要太长,虽然较长的FFT Time常量可以改善测定的信噪比。如果你真的加长了这个常量,它会增加测定时间和加大波形文件容量。较大的文件在滤波和分析时要花更多的时间。当测定完成后如果你发现你过大地估计了你的被测系统,可以用X Zoom工具和Save As命令去编辑多余的"噪声尾巴"

记录脉冲响应

如果你使用了内部Pink Noise Generator(粉红噪声发生器),请点击Generate Pink Noise按钮开始发送信号,并谨慎地调节电平控制器到目标电平。你还需要在Windows的音量控制器上去设定总的波形输出电平。如果你使用了外部信号发生器,请开始把信号传送到测试系统和计算机中。无论在哪种情况下,应将外部增益控制器和/或计算机的线路输入电平调节适当,使参考信号在输入表上为-12dB为宜。确认在计算机右输入声道上已经接收到参考信号(右边的蓝色"LED"仪表指示),由话筒来的测试信号从声道左边输入(左边的绿色"LED"仪表指示)。

如果需要,调节话筒预放增益,使参考信号(右)与测定信号(左)电平保持在输入表大约-12dB的电平上,点击Record按钮。

可懂度组件将记录你作为测定参数、处理数据,并且书写结果到指定的输出文件用的基本音频数据。当记录过程完成的时候,Record Impulse(记录脉冲)对话框会自动关闭,并且,新文件将会显示在主Plot Area(平面图区域图中的绿色部分)。

关于本软件中几个常用声学术语的解释

The dual Fast Fourier Transform (FFT) transfer function双重快速付里叶传递转移函数

 该转移函数是对两种信号,即典型的参考信号和测定信号做复杂比较。最通常地是比较一种设备,或一种系统的输入和输出,例如均衡器、声学系统或房间。当脉冲响应记录测定使用了双重快速付里叶传递转移函数法时,SIA-Smaart Intelligibility module就用了FFT的传递数据记录了两个音频数据,,并计算两个输入信号在频域内的转移函数。然后转变转移函数计算的结果(使用了一个反转的FFT),并显示在时域内,以表示设备或测试系统的脉冲响应。

STIRSTI语言传输指标

根据人的讲话本质上是由某些低频信号调制的基音波形的假定,STI就使用了Modulation Transfer function (MTF调制转移函数),去尝试几个倍频程并预测系统传播语言信息的能力。测定MTF时使用了"受人喜欢的语言模型的放大调制组件"测试信号,或宽带系统脉冲响应法(本SIA Intelligibility 组件使用了后一种方法)。0-1是作为STI的一个评价,0就意味完全难懂,1意味着可懂度指标完美。STI评价在0.7就是"""优秀"了。0.45-0.7评价为"漂亮"0.45以下的评价为"不够"

Rapid Speech Transmission Index (RSTI,急速语言传输指标)

是专门为短的STI开辟的计算法指标,所使用的数据为500 Hz2000 Hz倍频程带宽。由于STI几乎把人类听域的整个频谱都考虑进去了,所以RSTI比严格的STI计算有助于产生评价稍微偏高的数字。

 Clarity Factor (Cn)透明度系数(Cn

 听觉评价的另一个分量为透明度,它是声音发声时早期声与迟延声能量之比。早期声与迟延声分类是以毫秒计量,用Cn表示,在这儿,n是毫秒的意思,如C10C20C50等等。例如C50是表示在50毫秒内到达的直接声与总混响衰减声音能量之比。透明度的值超过5被评价为""2-5之间被评价为"漂亮"-2以下只能评价?quot;不够"。对于可懂度组件透明度系数缺省值为C50。另外还可使用的透明度系数有C35C7。你也可以改变这个透明度系数为你所喜欢的另一种透明度系数评价值。点击平面图上的Option按钮,选Graph标签,然后在Clarity框内键入你想要的毫秒数即可。

%ALCONS辅音音节损失百分率

这个指标可以采用传统主观测定,即发一张词语表给听众并让听众听音打分的办法;也可以采用计算脉冲响应或能量时间曲线来客观测定辅音音节损失百分率(%ALCONS)。04.0之间的%ALCons值为""124"漂亮"12以下为"不够"。计算%ALCONS有两种不同的公式,一种叫""方式,另一种叫""方式,而我们的可懂度组件对这两种方式都支持。二者之间主要不同的是""方式把周围的杂声考虑进去了,而""方式则没有。两者都倾向于相比其它几种可懂度测定方式而言,考虑能得到稍微宽松的答案,特别是""方式计算尤其如此。请注意,长"方式和""方式%ALCONS计算仅仅在倍频程2 kHz为中心的带宽下,并依赖于Ld, Lr Ln标记位置完成的。

 Reverberation Time ( T or Tn )混响时间(TTn

支持单位:中国环境保护产业协会噪声与振动控制专业委员会
版权所有:中城科数智慧城市规划设计研究中心 | ICP备案编号:京ICP备16040765号
电话:010-56034166 传真:010-88130775 | E-mail:nvct68@163.com
QQ:739436060 | 法律顾问:北京市常鸿律师事务所—王蔚律师