您好,欢迎访问

商机详情 -

江苏新一代语音关键事件检测是什么

来源: 发布时间:2024年01月14日

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。通过结合语音关键事件检测和自然语言处理技术,我们可以实现更加智能的语音助手和智能客服系统。江苏新一代语音关键事件检测是什么

    光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中包括n+1帧光流图。第二种情况:待分析图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像;场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中包括m+1帧场景图像;辅助图像为:光流图;光流图检测模型为:采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型,且每个第二样本图像为一帧光流图。第三种情况:待分析图像为:当前帧图像;场景图像检测模型为:采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型,且每个样本图像为一帧场景图像;辅助图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中包括n+1帧光流图。第四种情况:待分析图像为:当前帧图像;场景图像检测模型为:采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型,且每个样本图像为一帧场景图像;辅助图像为:光流图。江苏新一代语音关键事件检测是什么语音关键事件检测在音频编辑和音频处理领域也有应用,如自动剪辑音频中的特定部分或去除背景噪音等。

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。

    本发明实施例提供的一种事件检测方法,包括如下步骤:s300:实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;其中,目标防护舱指代的是需要进行事件检测的防护舱,并不具有任何其他限定意义。目标防护舱所对应的目标图像采集设备,实时对目标防护舱的内部空间进行图像采集,并将得到的关于目标防护舱的图像实时传输给的目标防护舱所对应的电子设备。这样,电子设备便可以实时获取关于目标防护舱的图像。其中,可以理解的,关于目标防护舱的图像可以为目标防护舱内部空间的图像。也就是说,上述目标图像采集设备可以在每个时刻采集关于目标防护舱的图像,进而,电子设备可以在每个时刻获得在该时刻时,关于目标防护舱的图像,该图像显示了每个时刻目标防护舱的内容空间的情况。则在当前时刻,电子设备所获得的关于目标防护舱的图像即为在当前时刻,目标图像采集设备所采集的关于目标防护舱的图像,这样,电子设备可以将该图像作为当前帧图像。显然,电子设备可以基于当前帧时刻,确定当前时刻,关于目标防护舱的事件检测结果。s301:检测当前帧图像是否包含目标对象,如果是,执行步骤s303;其中。随着深度学习技术的不断发展,语音关键事件检测的准确性和实时性将得到进一步提高。

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。语音关键事件检测的设备有哪些?欢迎咨询!江苏新一代语音关键事件检测是什么

在语音识别系统中,语音关键事件检测可以用于提高识别准确性和降低误识别率。江苏新一代语音关键事件检测是什么

    向告警装置输出告警指令。告警装置在接收到告警指令后执行告警操作,从而可以提醒救生人员。因此,本实用新型实施例中的方案能够及时准确地检测到溺水事件的发生,并及时地通知救生员进行救援。为使本实用新型的上述目的、特征和优点能够更为明显易懂,下面结合对本实用新型的具体实施例做详细的说明。本实用新型实施例提供了一种溺水事件检测系统。在本实用新型实施例中,溺水事件检测系统可以包括n个摄像头11、控制器12以及告警装置13。在具体实施中,n个摄像头11可以均设置在游泳池壁上。n个摄像头11在工作时,可以实时采集到游泳池内的图像。n个摄像头11与控制器12可以通信连接,从而可以将实时采集到的图像传输至控制器12。n个摄像头11可以通过有线连接的方式与控制器12通信连接,也可以通过无线连接的方式与控制器12通信连接。在本实用新型实施例中,n个摄像头11均通过无线连接的方式与控制器12连接。当n个摄像头11均通过无线连接的方式与控制器12通信连接时,在n个摄像头11中,可以均设置有相应的无线收发模块,以实现与控制器12的通信。例如,n个摄像头11与控制器12之间采用wifi进行通信,则在n个摄像头11中均设置有wifi收发模块。江苏新一代语音关键事件检测是什么