教学资源自动文摘系统的研究与设计
发布时间:2017-12-13 18:03
本文关键词:教学资源自动文摘系统的研究与设计
【摘要】:随着教育信息化的迅速发展,网络成为获取教学资源越来越重要的途径,电子格式学习资源的数量也越来越庞大。然而,庞大的资料数目为学习者提供宽广选择范围的同时也降低了筛选效率。从海量信息中快速选择出所需资源变得越来越重要。自动文摘技术能够对文档内容进行压缩和筛选,提炼出原始文档的核心内容,帮助用户快速了解文章主要内容,进而对文章进行筛选。 本文在现有自动文摘技术基本概念和方法的基础上,通过对国内外研究成果的分析梳理,对汉语特征词提取算法以及文章主题句抽取多种方法进行了分析研究。在关键词抽取和文摘句提取的算法选择方面,本文主要采用了基于词频的计算方法对文章进行关键词提取,并使用综合词权、位置、句型等多种特征的方法计算文章中每个句子的权重。最后,本文以思源网络教学平台为依托实现了一个实验性质的自动文摘系统,该系统能够生成效果较好的自动文摘。 系统首先对获取的教学资源文档进行文本格式转换,提取出其中的纯文本内容以备后续分析使用。对于符合条件且需要生成自动文摘的文档资源,系统会对其篇章结构进行浅层分析。分词是自动文摘技术的重要前提,本文选用分词效果较好的中科院汉语分词系统,并使用人工语料库进行文章关键词和候选文摘句的提取。然后通过基于语义词典的语义相似度计算方法降低同义句造成的冗余,并根据预定义的简单关联词规则对所生成自动文摘进行连贯性处理,提高其可读性。系统最后能够实现关键词和自动文摘的双重呈现。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:G434
【参考文献】
中国期刊全文数据库 前10条
1 梅家驹;竺一鸣;高蕴琦;殷鸿翔;;编纂汉语类义词典的尝试——《同义词词林》简介[J];辞书研究;1983年01期
2 于林林;魏琦;宋丽芳;;基于多种方法相融合的词义消歧的研究[J];电脑知识与技术;2010年33期
3 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报(自然科学版);2003年02期
4 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
5 李蕾,钟义信,郭祥昊;面向特定领域的理解型中文自动文摘系统[J];计算机研究与发展;2000年04期
6 马颖华,王永成,苏贵洋,张宇萌;一种基于字同现频率的汉语文本主题抽取方法[J];计算机研究与发展;2003年06期
7 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期
8 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
9 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
10 陈耀东,王挺;基于有向图的双向匹配分词算法及实现[J];计算机应用;2005年06期
中国博士学位论文全文数据库 前1条
1 朱林;基于特征加权与特征选择的数据挖掘算法研究[D];上海交通大学;2013年
,本文编号:1286047
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/1286047.html