基于HTML5的文档大纲分析器的设计与实现
发布时间:2017-11-10 13:15
本文关键词:基于HTML5的文档大纲分析器的设计与实现
【摘要】:迅猛发展的计算机、多媒体技术,使得互联网已成为人们访问信息的数据的最大来源。目前,大多数互联网的应用程序检索信息中,始终是以互联网上网页被视为无法再分的整体,信息存储和检索都是以网页为最小基本单位进行的。但写成的Web页和Web内容变得更加复杂多样,网页往往包含了很多复杂的多种信息,但是网页往往因为为了美观有过多的修饰,或者掺杂着一些无关紧要的广告等与人们需要的信息毫无关系的内容。 上述影响返回内容的精度的信息仍然存在于信息检索系统所得到的最后结果中,当检索系统将检索出的网页准确的反馈给用户,用户在面对一篇庞大而复杂的新网页是,就会眼花缭乱,很多时候,本地保存的文档更是不含有检索功能的,用户想要找到所需的内容必须将文档从头翻到最后,仍然有可能一无所获。所以,正确提取网页及文档的主题信息有着重要的意义,可以帮助用户快速了解网页及文档的内容。 本文主要包括以下研究内容: 1、通过分析国内外的信息化发展,分了目前信息检索系统存在的问题和难点,鉴于此提出课题的研究目的、内容和意义,并且论述了信息提取的技术在国内外的研究现状。 2、对系统设计过程中理论基础和所使用的关键技术进行介绍,包括它们的特点、使用平台等。 3、主要是分析和介绍了系统的需求分析。HTML5文档大纲分析器的需求分析主要包括系统的是否可行,包括运行是否可行和技术是否可行;然后着重介绍并分析了本系统中主要的功能模块需求。接着,从非功能方面对系统需求进行了分析,介绍了系统的设计原则与注意事项。 4、主要是介绍系统设计开发及代码实现方面的工作。按照软件开发的严格流程,本章从系统的设计目标入手,接着介绍系统的概要设计,介绍了系统的功能结构设计,并对这部分进行了设计,介绍了所需要的实现内容以及设计思路以及代码实现。 5、总结了设计和实现该套系统的最终效果和成果,并且分析了系统中存在的问题,并进行了进一步的展望以及下一步的工作。总之,通过对该课题的研究,并在企业采购部成功实施PDM系统,为同行业的信息化建设提供成功的应用示范和经验,为促进同行业产业结构的调整和管理机制的创新奠定了基础。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.52
【参考文献】
中国期刊全文数据库 前10条
1 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期
2 肖绘郦;李建伟;勾学荣;;基于课程领域本体智能答疑的应用研究[J];北京邮电大学学报(社会科学版);2008年01期
3 马海龙;曾庆军;;互联网协议和技术的新进展[J];广播电视信息;2014年02期
4 周必水;蒋鹏;;基于语义网的电子政务文档检索技术的实现[J];杭州电子科技大学学报;2006年04期
5 李蕾;王劲林;白鹤;胡晶晶;;基于FFT的网页正文提取算法研究与实现[J];计算机工程与应用;2007年30期
6 王志琪;王永成;;HTML文件的文本信息预处理技术[J];计算机工程;2006年05期
7 于满泉,陈铁睿,许洪波;基于分块的网页信息解析器的研究与设计[J];计算机应用;2005年04期
8 熊圣芬;贺智明;王俊;;基于JavaScript和DOM的动态表单设计及数据提交[J];江西理工大学学报;2009年01期
9 王海波;张润;王兆华;;支持HTML5结构分析的语义Web框架JenaPro[J];计算机与现代化;2013年06期
10 丁晟春,顾德访;Jena在实现基于Ontology的语义检索中的应用研究[J];现代图书情报技术;2005年10期
,本文编号:1166782
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1166782.html