您好,欢迎访问

商机详情 -

江苏新一代声学回声介绍

来源: 发布时间:2022年06月01日

    首先是优化准则。NLMS算法是基于小均方误差准则,而双耦合算法是基于小平均短时累计误差准则,所以他们的优化准则是不一样的。第二个就是理论的比较好解,NLMS算法具有Wiener-Hopf方程解,而双耦合算法的线性滤波器也具有Wiener-Hopf方程解,非线性滤波器具有小二乘解。第三个维度就是运算量,NLMS运算量是O(M),M是滤波器的阶数,而双耦合算法运算量后面会多一个O(N2),因为他有两个滤波器,N是非线性滤波器的阶数,这里的平方是因为小二乘需要对矩阵进行求逆运算,所以它的运算量比线性的NLMS运算量要大很多。第三个就是控制机制,NLMS算法只有一个滤波器,它的控制主要是通过调整步长来实现的,控制起来要相对简单。而双耦合算法需要对两套滤波器进行耦合控制,控制的复杂度要高很多。实验结果分析,这里我主要是分了两个实验场景比较双耦合算法和NLMS算法的性能,个是单讲测试场景,第二个就是双讲测试场景。首先看一下单讲测试场景,个示例是针对强非线性失真的情况,左边分别原信号的语谱,NLMS算法进行回声消除之后的语谱、双耦合算法的语谱。颜色越深,能量越大。右边这个的是回声抑制比,值越大越好,红色的曲线是双耦合算法的回声抑制比。

    回声消除AEC(AcousticEchoCancellation)一般指的是声学回声消除,其主要用于抑制产品本身发出的声音。江苏新一代声学回声介绍

江苏新一代声学回声介绍,声学回声

    WebRtcAec_Process接口如上,参数reported_delay_ms为当前设备需要调整延时的目标值。如某Android设备固定延时为400ms左右,400ms已经超出滤波器覆盖的延时范围,至少需要调整300ms延时,才能满足回声消除没有回声的要求。固定延时调整在WebRTCAEC算法开始之初作用一次,为什么target_delay是这么计算?inttarget_delay=startup_size_ms*self->rate_factor*8;startup_size_ms其实就是设置下去的reported_delay_ms,这一步将计算时间毫秒转化为样本点数。16000hz采样中,10ms表示160个样本点,因此target_delay实际就是需要调整的目标样本点数(aecpc->rate_factor=aecpc->splitSampFreq/8000=2)。我们用330ms延时的数据测试:如果设置默认延时为240ms,overhead_elements次被调整了-60个block,负值表示向前查找,正好为60*4=240ms,之后线性滤波器固定index=24,表示24*4=96ms延时,二者之和约等于330ms。②大延时检测是基于远近端数据相似性在远端大缓存中查找相似的帧的过程,其算法原理有点类似音频指纹中特征匹配的思想。大延时调整的能力是对固定延时调整与线型滤波器能力的补充,使用它的时候需要比较慎重。需要控制调整的频率,以及控制造成非因果的风险。

     江苏新一代声学回声介绍TWS耳机异音,底噪,回声测试难点。

江苏新一代声学回声介绍,声学回声

    至于双讲恢复能力WebRTCAEC算法提供了{kAecNlpConservative,kAecNlpModerate,kAecNlpAggressive}3个模式,由低到高依次不同的抑制程度,远近端信号处理流程,NLMS自适应算法(上图中橙色部分)的运用旨在尽可能地消除信号d(n)中的线性部分回声,而残留的非线性回声信号会在非线性滤波(上图中紫色部分)部分中被消除,这两个模块是WebrtcAEC的模块。模块前后依赖,现实场景中远端信号x(n)由扬声器播放出来在被麦克风采集的过程中,同时包含了回声y(n)与近端信号x(n)的线性叠加和非线性叠加:需要消除线性回声的目的是为了增大近端信号X(ω)与滤波结果E(ω)之间的差异,计算相干性时差异就越大(近端信号接近1,而远端信号部分越接近0),更容易通过门限直接区分近端帧与远端帧。非线性滤波部分中只需要根据检测的帧类型,调节抑制系数,滤波消除回声即可。下面我们结合实例分析这套架构中的线性部分与非线性分。线性滤波线性回声y'(n)可以理解为是远端参考信号x(n)经过房间冲击响应之后的结果,线性滤波的本质也就是在估计一组滤波器使得y'(n)尽可能的等于x(n),通过统计滤波器组的比较大幅值位置index找到与之对齐远端信号帧,该帧数据会参与相干性计算等后续模块。

    

    他的是线性回声传递函数。基于这样的数学假设,我们收到的信号y就可以表示成发射的信号x分别跟这样两个传递函数进行卷积之后的结果。接下来我们对这个模型进行了适当的简化,简化主要是基于数学分解,我们假设非线性的传递函数,可以分解成线性跟非线性这样两个系统函数的组合形式,就会得到中间的方程。接下来对中间的方程进行变量替换,就得到这个表达式,这个表达式它的物理意义很清晰,我们从可以看到,整个回声路径是可以表示成线性回声路径跟非线性回声路径二者之和的形式,这是它的物理意义。2.双耦合自适应滤波器,基于这样一个数学模型,接下来我们就构建了一种新的滤波器结构,称之为双耦合自适应滤波器。这个滤波器跟传统线性的自适应滤波器相比,主要有两个方面的不同,个不同是传统的线性滤波器只有一个学习单元,而我们的这个滤波器有两个学习单元,分别是这里的线性回声路径滤波器,我们用Wl来表示。还有非线性的回声路径滤波器,我们用Wn来表示。第二个不同就是,我们在这两个滤波器之间还加入了一个耦合因子,这个耦合因子目的就是为了协同二者更好的工作,让二者能够发挥出比较大的效能,甚至能够起到1+1>2的效果。

  AEC声学回声,电话的扬声器的声音(包括反射声),被麦克风拾取传送给远端,使远端说话人又听到自己的声音。

江苏新一代声学回声介绍,声学回声

    底噪也就是本底噪声,一般指在电声系统中,除去有用的信号外的总噪声。底噪有来自于固有的电子、电磁噪音,也有确是功放电路或电源性能问题导致的。理论上底噪是无法去除的,当然只有当底噪大到影响听感的时候才是问题。很多时候可以提高信噪比把底噪给压低,这确实可以降低听音乐时噪声的影响。但是总之人们还是有带耳机不听音乐的时候,典型的如ANC耳机降噪工作的时候,此时显得尤为重要,近期几大品牌都因为ANC底噪问题造成过批量退货。为了准确的检测产品底噪,我们需要知道目前行业内耳机功放工作类型大概有以下两种:1、产品处于蓝牙播放状态时,功放IC有打开,输入端无任何音源,喇叭输出端有底噪信号输出。2、产品处于蓝牙播放状态时,IC会被系统静音,信号输入端需要给一个很小信号触发功放IC打开,喇叭输出端有底噪信号输出。总的来说,底噪时需要多种指标和技术手段来验证和管控。指南测控整个标准声学测试系统通过极高灵敏度的仪器和声学传感器,采用多种评估底噪能量值的方法,以及专门为底噪测试而设计的箱体及治具结构,测试软件逻辑等一体化的设计,可以准确快速的进行底噪测试。下图TWS耳机中的左耳,在喇叭播放空声源时,喇叭端有略微的电流声底噪。 声学回声是由于麦克风和扬声器的声学泄露耦合而成。江苏新一代声学回声介绍

声学回声消除应用技术。江苏新一代声学回声介绍

    噪声抑制和声源分离同属于语音增强的范畴,如果把噪声理解为广义的噪声三者之间的关系,噪声抑制需要准确估计出噪声信号,其中平稳噪声可以通过语音检测判别有话端与无话端的状态来动态更新噪声信号,进而参与降噪,常用的手段是基于谱减法(即在原始信号的基础上减去估计出来的噪声所占的成分)的一系列改进方法,其效果依赖于对噪声信号估计的准确性。对于非平稳噪声,目前用的较多的就是基于递归神经网络的深度学习方法,很多Windows设备上都内置了基于多麦克风阵列的降噪的算法。效果上,为了保证音质,噪声抑制允许噪声残留,只要比原始信号信噪比高,噪且听觉上失真无感知即可。单声道的声源分离技术起源于传说中的鸡尾酒会效应,是指人的一种听力选择能力,在这种情况下,注意力集中在某一个人的谈话之中而忽略背景中其他的对话或噪音。该效应揭示了人类听觉系统中令人惊奇的能力,即我们可以在噪声中谈话。科学家们一直在致力于用技术手段从单声道录音中分离出各种成分,一直以来的难点,随着机器学习技术的应用,使得该技术慢慢变成了可能,但是较高的计算复杂度等原因,距离RTC这种低延时系统中的商用还是有一些距离。噪声抑制与声源分离都是单源输入。

     江苏新一代声学回声介绍