基于深度语义挖掘的标题生成技术研究与实现

发布时间：2021-03-08 07:57

　　信息化的迅速发展给人们带来便利的同时,也使得网络中充斥着大量冗余、非结构化的文本信息,这也大大降低了人们获取信息的效率。自动摘要技术可以帮助人们快速地获取信息,而利用标题生成技术则可以获得更加简洁的摘要。本文将其作为研究任务,针对短文本语料和长文本语料,分别从文本特征表示和层级模型两个方面深入挖掘文本语义信息进行标题生成。在文本特征表示方面,为了深入挖掘语义信息,本文针对短文本语料进行了基于词向量的文本特征表示研究。在词向量基础上,引入多种抽取式摘要中常用的特征,如词频、位置、聚类以及层次分布等特征,使文本特征表示对标题生成具有任务倾向性,并对这些文本特征的不同组合和表示进行相关研究;引入这些特征可以从语言学、统计学等角度对文本语义进行深入挖掘。在特征表示时,本文将词向量与引入特征直接进行拼接;并在此基础上,针对标题生成任务训练专门的词向量,利用命名实体,词性、主题特征等信息构造新的词向量训练语料,以期得到的词向量包含部分语言学和统计学信息等。在标题生成任务中引入抽取式摘要特征可以与词向量在表示语义时相互补充,从而全面多角度地深入挖掘文本语义信息。通过对比实验验证其有效性。此外,对稀疏...

【文章来源】：北京邮电大学北京市 211工程院校教育部直属院校

【文章页数】：72 页

【学位级别】：硕士

【部分图文】：

图２－１?Ｓｅｑ２ｓｅｑ模型展开丨句??如图２－１所示，Ｓｅ２Ｓｅ模型主要包括编码器和解码器，其中ｉ?＝?１，２，Ｎ

结构示意图,隐含层,权重矩阵,网络单元

以及状态转移的计算，模型的计算量也会随着时序状态的增加呈指数增长。而循??环神经网络ＲＮＮ通过在不同的时序状态共享参数极大地减少了计算量，同时又??能记忆序列信息。图２－２为ＲＮＮ网络的基本结构示意图。??输出层?％??Ｖ＼??隐含层?州??输入层?ｘ??图２－２?ＲＮＮ网络基本结构示意图??一般的神经网络（如多层感知机以及ＤＮＮ等）包括输入层、隐含层和输出??层，层与层之间通过权值连接。同样地，如图２－２所示的ＲＮＮ网络也包含输入??层、隐含层和输出层；而在ＲＮＮ网络中不仅层与层之间有权重相连（图２－２中??的权重矩阵Ｕ，Ｖ为层与层之间的权重连接），而且隐含层自身也有权重连接，通过??权重矩阵Ｗ将上一时刻的信息传递到下一时刻，这也是ＲＮＮ能对时序信息进行??记忆建模的原因。??°ｔ￣ｌ?°ｔ?°ｔ?＋?ｌ??Ａ?皮??ｘｔ－＼?ｘｔ?＋?ｌ??图２－３?ＲＮＮ网络单元展开图??图２－３为图２－２中ＲＮＮ网络单元随时间的展开图，ＲＮＮ网络可以随时间或??序列递归，是一种能够学习时序信息的模型。图２－３中的ｘｔ是ＲＮＮ在时刻ｔ的输??１０??

网络单元,展开图,隐含层

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3070703.html

上一篇：翻转课堂教学模式应用于中职英语口语教学中的实验研究
下一篇：北京城市副中心智慧园林资源服务平台研建

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|