您好,欢迎访问

商机详情 -

河北新一代语音关键事件检测标准

来源: 发布时间:2023年06月22日

    本发明涉及语音关键事件检测技术,特别是涉及一种事件语音关键事件检测。背景技术:当前,很多银行通过设置语音关键事件检测防护舱来为用户提供更便捷的金融服务。所谓防护舱,是一种离行式或在行式的智能化金融服务设施,其具有完善的结构设计,可以实现智能化控制和远程监控,保障内部atm(automatictellermachine,自动柜员机)及其它金融服务设备全天候安全、以及可靠地运行。其中,离行式是指设置在银行营业网点之外的地方,例如,住宅小区、校园、地铁站等公共场所;在行式是指设置在银行营业网点中。可以理解的,当用户进入语音关键事件检测防护舱进行金融活动时,有些时候会出现倒地、剧烈运动、破坏设备等异常事件,例如,老人突然身体不适晕倒、有人抢夺用户的银行卡、有人恶意破坏设备等情况。为了保障用户的人身和财产安全,需要对用户在防护舱中出现的异常事件进行检测,以便于可以及时救治或报警。相关方案中,检测用户在语音关键事件检测防护舱内出现倒地事件的方案是:在防护舱的两侧面板上距离地面1米。这样,用户在进入到防护舱时,便进入到红外线发射器的感测范围内,进而,由于用户身体的遮挡。语音关键事件检测的意义是什么?河北新一代语音关键事件检测标准

    通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。需要说明的是,在本文中,诸如和第二等之类的关系术语用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。河北新一代语音关键事件检测标准语音关键事件检测是高科技吗?

    上述步骤s302a可以为:步骤s302b:判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象;如果是,执行上述步骤s303。在本实现方式中,在获取到当前帧图像后,电子设备便可以利用图像识别算法判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象。其中,当判断结果为是时,电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,在本实现方式中,电子设备可以采用任一能够检测出当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302b,对此,本发明实施例不做具体限定。其中,上述预设时长可以为任一时长,例如,2s,5s等,这都是合理的。下面,对电子设备执行上述步骤s302b的具体过程进行说明:电子设备在获取到每帧关于目标防护舱的图像后,判断该图像中是否包含目标对象。进而,在获取该图像的下一帧图像后,判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推。

    检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。在该检测模型的训练过程中,可以将各个样本图像作为待训练模型的输入,将各个样本图像的事件检测结果作为待训练模型的输出。这样,在训练过程中,待训练模型可以学习各个样本图像中的图像特征,输出各个样本图像的事件检测结果,逐步建立样本图像的图像特征和事件检测结果的对应关系。这样,经过大量样本图像的学习,便可以得到上述检测模型。而该训练得到的检测模型也就可以用于对基于当前帧图像确定的待分析图像进行检测,输出的事件检测结果,即为关于目标防护舱的事件检测结果。显然,在训练上述检测模型时,所使用的样本图像为关于防护舱的图像。需要强调的是,不同类型和数量的待分析图像,所利用的检测模型也是不同的。为了行为清楚,后续将会对待分析图像与检测模型之间的对应关系进行举例说明。需要说明的是,上述检测模型可以在电子设备中训练得到的,也可以在与电子设备通信连接的其他电子设备中训练得到的,这样,电子设备便可以从该其他电子设备中获得上述检测模型,这都是合理的。此外,在本发明实施例中,电子设备可以检测目标防护舱内是否发生异常事件,则在这种情况下。语音关键事件检测一般应用在什么行业?

    光流图检测模型为:采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型,且每个第二样本图像为一帧光流图。需要说明的是,下面对上述步骤f23的具体实现方式进行举例说明。一种具体实现方式中,上述步骤f23可以包括如下步骤f231-f232:f231:根据场景图像检测模型和光流图检测模型的权重,计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积,并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积;f232:计算乘积和第二乘积的和值,基于和值,确定关于目标防护舱的事件监测结果。在本实现方式中,当场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果为:正常事件概率以及每种类型的异常事件的概率时,电子设备可以根据预设的场景图像检测模型的权重,计算场景图像检测模型输出的正常事件概率以及每种类型的异常事件的概率分别与该权重的乘积,作为正常事件以及每种类型的异常事件的乘积;并根据预设的光流图检测模型的权重,计算光路途检测模型输出的正常事件概率以及每种类型的异常事件的概率分别与该权重的乘积,作为正常事件以及每种类型的异常事件的第二乘积。进而,计算乘积和第二乘积的和值。语音关键事件检测的历史作用?河北新一代语音关键事件检测标准

语音关键事件检测的优缺点?河北新一代语音关键事件检测标准

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。河北新一代语音关键事件检测标准

深圳鱼亮科技有限公司发展规模团队不断壮大,现有一支专业技术团队,各种专业设备齐全。致力于创造***的产品与服务,以诚信、敬业、进取为宗旨,以建Bothlent产品为目标,努力打造成为同行业中具有影响力的企业。我公司拥有强大的技术实力,多年来一直专注于语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。的发展和创新,打造高指标产品和服务。深圳鱼亮科技始终以质量为发展,把顾客的满意作为公司发展的动力,致力于为顾客带来***的智能家居,语音识别算法,机器人交互系统,降噪。