智能语音会议纪要系统的设计与实现

发布时间：2024-06-10 19:49

　　随着人工智能技术的发展,越来越多的研究者和开发者使用机器学习和深度学习的算法开发出更加智能化的应用。人工智能领域包括机器人、语音识别、图像识别、自然语言处理和专家系统。在日常生活中,语音识别和自然语言处理应用最为广泛,但是这些算法在使用上比较单一,没有将两种或多种组合算法和技术应用到同一个场景中。技术是自然语言处理中应用最为广泛的技术之一,该技术在不改变大篇幅文档原意的情况下,自动的总结生成主要内容。在这个海量的信息时代,这项用简短的文本表达信息主要内容的技术,有利于缓解信息过载问题。机器情感分析是人们对问题、事件或话题的观点、情绪和态度的计算研究。情感分析技术使得机器通过语音和文字来感知情感,在特定场景下,利用语音和文字的情感,发掘潜在的用户信息和商业信息。本文基于深度学习中语音识别技术、文本摘要抽取技术和情感分析技术实现了智能语音会议纪要系统。首先,系统语音处理模块由说话人分类模块和语音识别模块组成。语音处理模块用于将会议语音转化为会议剧本。说话人分类模块利用说话人多音频流时间轴策略对会议语音中的说话人进行分类和标记,主要研究和实现了语音端点检测技术。语音识别模块主要研究语音识别现...

【文章页数】：89 页

【学位级别】：硕士

【部分图文】：

图1.2CALO会议系统架构图

视为一个基本的信息单元，并假定文档是固定的，并包含关于单个实体的意级别情感分类是对文档中的单个句子进行分类。但是，不能假定每个句子都见的。某种意义上说，人们通常首先将一个句子分类为固执和非固执，这成分类。然后，由此产生的固定句子被分类为表达积极或消极的情感。句子级类也可以表述为三....

图2.1隐形马尔可夫模型

为特征向量。生成参数数量的方法是根据具体语音进行调节的工作，但在一个简单的情况下，它是频谱的衍生物。图2.1隐形马尔可夫模型其次，它是模型的概念。模型描述了一些收集说出的单词的共同属性的数学对象。

图6.1音频分割运行结果图

说话人分类的过程，简单说主要是将收集的音频流文件通过语音端点检测进行智能分割，保留说话人语音片段，并进行排序的过程。图6.1音频分割运行结果图

图6.2用户所对应的时间和语音片段当单独一个音频流文件进行分割完全后，系统会将用户名，会议名，分割后的音频文件组和每段音频的起始时间都存到数据库中，当系统需要对音频片段按照时间轴

静音阶段）。同时，将语音起始的时间点和终止的时间点分别标记并存储到对应的数据库中。图6.2用户所对应的时间和语音片段当单独一个音频流文件进行分割完全后，系统会将用户名，会议名，分割后的音频文件组和每段音频的起始时间都存到数据库中，当系统需要对音频片段按照时间轴排序时要从数据库中....

本文编号：3991819

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3991819.html

上一篇：基于BP神经网络的教学认知诊断方法及应用
下一篇：基于随机游走的连接隐私保护方案研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|