内容无关的话者验证模型及其应用
发布时间:2021-01-20 03:23
目前的“人工智能”因为深度神经网络的出现而达到了一个新的发展阶段,深度学习技术以其能从相对原始的数据中提取丰富信息的能力而被应用于各大领域,带动了人工智能应用的落地。语音信号处理方面的应用在深度学习技术的推动下快速发展,语音数据本身就包含语言学信息、副语言学信息等多类信息,深度神经网络可以根据任务目标自动抽取目标所需要的信息而尽量剔除其余信息,在语音领域有着显著的推动作用。深度神经网络在话者识别领域也有所发展,但目前基于深度神经网络的话者识别模型大多是内容相关的,在进行验证时,同时用到了语言学信息,且对语音片段的长度有要求,而实际应用场景中,话者提供给模型进行识别的语音片段持续时间更短,因此本课题提出了应用于短语音片段的内容无关话者验证模型。对语音片段进行降噪操作之后,我们会将语音片段转化成频谱特征。语音信号数据属于时间序列数据,但在内容无关的说话人验证任务中,我们要提取的话者个人信息并不是时序信息,所以我们用卷积神经网络模型来提取特征,并与GRU网络模型提取的特征相比较。为了改进模型,我们提出了同时训练多个损失函数的多任务验证模型,其中用到了三重态损失函数(TripletLoss)与...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
技术发展图
谱减法降噪以前的语音音波图
图 3-2 谱减法降噪以后的语音音波图图 3-3 谱减法求得的噪音音波图除静音段静音段,对于人耳来说基本不会影响,但在语音信号信号这个数组中并不是 0 或者某个常数,这部分的数这部分数据会增加语音片断里的噪音信息,增加会话精度受影响,为此,在实际操作中,会去掉这部分静
本文编号:2988270
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
技术发展图
谱减法降噪以前的语音音波图
图 3-2 谱减法降噪以后的语音音波图图 3-3 谱减法求得的噪音音波图除静音段静音段,对于人耳来说基本不会影响,但在语音信号信号这个数组中并不是 0 或者某个常数,这部分的数这部分数据会增加语音片断里的噪音信息,增加会话精度受影响,为此,在实际操作中,会去掉这部分静
本文编号:2988270
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2988270.html