面向新媒体的新闻缩写关键技术研究
本文关键词:面向新媒体的新闻缩写关键技术研究
【摘要】:随着新媒体的快速发展,网络新闻呈现出雨后春笋的态势,人们面临信息选择困难、信息超载等问题。大量的冗余信息一方面增加了用户阅读信息的时间,另一方面还增加了用户发现和理解热点话题的困难。移动设备的普及更是带动了新闻客户端的大量产生,这些移动设备的特点是屏幕小,信息量过大时不能单屏显示,分屏又会导致阅读的不便。因此,新闻自动缩写技术应运而生,新闻缩写不仅可以获得简约而明了、有深度且有态度的内容资源,而且能提升网络新闻的品质,实现网络新闻的增值阅读。本文对新闻标题和新闻正文的缩写技术展开一系列研究。针对新闻标题,借助于词对齐技术应用规则与统计结合的方法进行压缩。针对新闻正文内容,提出句子压缩与句子选择结合的框架来生成新闻正文的压缩结果。该框架中,首先应用句子多特征融合的方法进行摘要句子预选择,根据句子多特征权重排序抽取最具有代表性的句子。然后针对预选择的摘要句子,提出一种基于关键词的启发式句子压缩算法,该算法作为中间阶段被应用于生成原句子的压缩变体。最后通过整数线性规划算法去除冗余,选取出信息量最大的最终新闻摘要。在评测方面,本文提出一种句子压缩基础上的自动摘要评测方法。该方法通过信息的重要性、语法规范性和压缩比对压缩后的句子进行打分,随后在摘要的评测中结合句子压缩分数计算出准确率、召回率以及F值分别为79.26%、76.32%和77.76%。实验结果表明,本文提出的新闻缩写算法切实可行,能对给定的新闻文章自动生成一段连贯且具有象征性的高密度新闻摘要。
【关键词】:特征 句子压缩 启发式规则 句子选择
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G210.7;TP391.1
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-17
- 1.1 研究背景和意义10-11
- 1.2 国内外研究现状11-14
- 1.3 论文的主要工作14-15
- 1.4 论文的组织形式15-17
- 第2章 相关理论及方法17-28
- 2.1 新闻缩写的预处理技术17-20
- 2.1.1 中文分词17
- 2.1.2 命名实体识别17-18
- 2.1.3 句法分析18-20
- 2.2 缩写常用算法模型20-23
- 2.2.1 噪声信道模型20-21
- 2.2.2 剪枝模型21-22
- 2.2.3 同步树替代文法模型22-23
- 2.3 摘要提取相关算法23-27
- 2.3.1 整数线性规划23-25
- 2.3.2 句子增强技术25-26
- 2.3.3 社交网络打分机制26-27
- 2.4 本章小结27-28
- 第3章 新闻内容单句缩写算法28-43
- 3.1 研究概述28
- 3.2 新闻标题缩写算法28-36
- 3.2.1 词对齐技术30
- 3.2.2 基于GIZA++的词对齐30-33
- 3.2.3 基于同义词林的词对齐33-35
- 3.2.4 基于规则与统计的句子压缩算法35-36
- 3.3 基于关键词的启发式句子压缩算法36-42
- 3.3.1 关键词提取36-38
- 3.3.2 启发式的语言学规则38-41
- 3.3.3 压缩结果修复41-42
- 3.4 本章小结42-43
- 第4章 基于句子多特征与冗余处理的新闻正文压缩算法43-49
- 4.1 研究概述43-44
- 4.2 句子权重计算44-46
- 4.2.1 基于特征融合的词语权重44-45
- 4.2.2 句子多特征45-46
- 4.2.3 句子权重值46
- 4.3 句子相似度计算46-47
- 4.4 基于整数线性规划的句子选择算法47-48
- 4.5 本章小结48-49
- 第5章 实验系统原型设计与结果分析49-58
- 5.1 实验环境49
- 5.2 实验系统原型设计49-50
- 5.3 实验结果分析50-56
- 5.3.1 新闻标题缩写算法实验分析50-52
- 5.3.2 新闻正文摘要抽取及缩写实验分析52-56
- 5.4 本章小结56-58
- 结论58-60
- 参考文献60-64
- 附录 新闻缩写示例原文64-66
- 攻读学位期间发表的论文与研究成果清单66-67
- 致谢67
【相似文献】
中国期刊全文数据库 前10条
1 范洪涛;新闻标题专著《美国盼兮》出版[J];新闻与写作;2000年01期
2 盛书刚;一条有误导倾向的新闻标题[J];语文建设;2000年02期
3 郭银土;“画龙点睛”──浅议新闻标题的作用和制作[J];福建商业高等专科学校学报;2000年03期
4 王同伦;报刊新闻标题中潜性语言开发和应用分析[J];连云港教育学院学报;2000年01期
5 程跃慧;报纸新闻标题的形式美[J];新闻前哨;2000年03期
6 张泽勇;新闻标题的魅力[J];新闻前哨;2000年06期
7 程金太;准确是新闻标题的生命[J];采.写.编;2000年01期
8 黄颂明;报纸口语化新闻标题的传播优势[J];新闻通讯;2000年09期
9 张保田;;新闻的制题艺术[J];记者摇篮;2000年11期
10 侯恩贵;;让新闻标题“跳起来”[J];记者摇篮;2000年06期
中国重要会议论文全文数据库 前9条
1 陈丽昭;;汉英新闻标题的语法特点对比[A];福建省外国语文学会2002年会论文集[C];2002年
2 李娜;;俄语报刊中新闻标题的修辞手法趣谈—以Русская газета为例[A];福建省外国语文学会2013年年会暨海峡两岸翻译学术研讨会论文集[C];2013年
3 刘禀诚;;新闻标题的分句隐含[A];江西省语言学会2008年年会论文集[C];2008年
4 朱思;丁浩;;自然灾难新闻标题的翻译[A];福建省外国语文学会2009年年会暨学术研讨会论文集[C];2009年
5 卫晓莉;;《今日气象》气象新闻分析[A];中国气象学会2005年年会论文集[C];2005年
6 姚红卫;;谈谈当代体育新闻标题的语言艺术[A];第八届全国体育科学大会论文摘要汇编(二)[C];2007年
7 陈朝晖;;有关法制新闻标题的质疑与思考[A];中国传媒大学第五届全国新闻学与传播学博士生学术研讨会论文集[C];2011年
8 彭建武;季英奎;;新闻标题中的冒号在心理空间建构中的作用[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
9 彭建武;季英奎;;新闻标题中的冒号在心理空间建构中的作用[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 静秀丽;浅谈新闻标题如何出新[N];赤峰日报;2007年
2 尉颖颖;灾难新闻标题小议[N];中国新闻出版报;2006年
3 刘海贤邋原《北海晚报》副总编辑,现《北海日报》新闻研究室主任;新闻标题:要解读新闻的“核”[N];中华新闻报;2008年
4 马凡德;浅谈新闻标题的制作[N];中华新闻报;2008年
5 王元中南财经政法大学公安学院;浅谈公安新闻标题要注意的问题[N];今日信息报;2009年
6 喀什日报社 王文博;浅谈电视与报纸的新闻标题差异性[N];喀什日报(汉);2010年
7 驻马店电视台 张淑贞;艺术化新闻标题特色[N];驻马店日报;2011年
8 长治日报社 曹云;精心打造吸人眼球的新闻标题[N];山西党校报;2012年
9 郑旭辉;新旧媒体新闻标题的“合”与“离”[N];中国新闻出版报;2013年
10 刘辉;浅谈如何做好新闻标题[N];安徽经济报;2004年
中国博士学位论文全文数据库 前3条
1 白丽娜;空间的制约与语言的表达[D];华东师范大学;2013年
2 王燕;新闻语体研究[D];复旦大学;2003年
3 黄裕\,
本文编号:956273
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/956273.html