当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于领域本体的垂直搜索引擎页面排序算法的研究

发布时间:2016-09-10 20:06

  本文关键词:基于领域本体的垂直搜索引擎页面排序算法的研究,由笔耕文化传播整理发布。


《兰州理工大学》 2014年

基于领域本体的垂直搜索引擎页面排序算法的研究

王清霞  

【摘要】:伴随着网络信息资源的剧增,搜索引擎的重要性与日俱增。网页排序算法是检索引擎关键部分。如何有效的查找需要的信息是非常关键的,一个好的搜索引擎可以极大的节省用户查找信息的时间。搜索引擎包含多个组成部分,其中网页排序结果的准确率直接决定了搜索引擎的性能和用户体验。信息检索领域中有许多的网页排序算法,其中基于链接分析的算法运用比较广泛。通过对垂直搜索引擎的工作原理与架构、本体等相关技术的研究,在此基础上,对基于电子商务领域本体的模型构建、语义因素、排序算法优化进行了深入的研究。主要研究内容包括以下几个方面: 1.通过研究现有的页面排序算法,分析了存在的不足,并介绍了网页的评价标准,针对返回结果相关性、用户的体验、响应时间等问题,提出了基于PageRank算法的改进策略,将语义因素应用在垂直搜索排序算法中,从而提高了搜索结果的准确率 2.本体相关技术的分析,构建规则,建模元语以及分类,构建了电子商务领域的本体,并引入WordNet语义关系的词典,运用在垂直搜索引擎的排序算法中。在此基础上,提出一个基于电子商务领域的概念相似度计算方法。通过编程实现了词网络,即给定一个词语能够查出该词的所有同义词,并通过实验验证了改进后的相似度算法在中英文环境下进行语义相似度计算效果。 3.对基于领域本体的垂直搜索引擎系统实现,将改进的PageRank算法应用在本系统中,系统包括信息获取模块、Lucene索引模块、本体的构建与管理模块和查询扩展与结果展示模块。最后,用Loadrunner性能测试工具从吞吐量、平均响应时间,Hits/second三个方面验证了系统的性能,最终得出价值程度较高的页面,进而满足用户的需求。

【关键词】:
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前10条

1 余旸;夏国平;;基于链接结构分析的主题搜索[J];北京工业大学学报;2011年04期

2 钱功伟;倪林;曹荣;;基于网页链接和内容分析的改进PageRank算法[J];计算机工程与应用;2007年21期

3 曹泽文;钱杰;张维明;邓苏;;一种综合的概念相似度计算方法[J];计算机科学;2007年03期

4 文坤梅;卢正鼎;孙小林;李瑞轩;;语义搜索研究综述[J];计算机科学;2008年05期

5 吴柏林;宋泽锋;杨炳儒;;一种基于本体的垂直搜索引擎系统模型[J];计算机工程与科学;2008年10期

6 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期

7 丁岳伟;郭辉;;利用蚁群算法对PageRank算法的改进[J];计算机应用;2009年10期

8 张颖;王文杰;史忠植;;基于本体的文本分类方法[J];计算机仿真;2009年05期

9 蒋秀林;谢强;丁秋林;;基于领域本体的用户模型的研究[J];计算机应用研究;2012年02期

10 温泉;丁祥武;;基于主题聚焦模型的PageRank改进算法[J];计算机应用与软件;2011年03期

【共引文献】

中国期刊全文数据库 前10条

1 高炜;梁立;;基于概念匹配的本体映射算法[J];安徽大学学报(自然科学版);2010年06期

2 刘珊慧;万韵;杨乐;;基于本体的农业信息资源语义检索过程研究[J];安徽农业科学;2009年23期

3 黄洪;刘增良;余达太;周绍华;;一种具有免疫特征的智能数据分类分级模型[J];兵工学报;2010年12期

4 黄洪;刘增良;余达太;;一种智能化的数据分类、分级及保护模型[J];北京工业大学学报;2011年06期

5 闻敬谦;李青;;基于本体的语义相似在维修案例推理中应用[J];北京航空航天大学学报;2009年02期

6 张鹏;王国胤;陶春梅;罗海;;基于本体粗糙集的程序代码相似度度量方法[J];重庆邮电大学学报(自然科学版);2008年06期

7 谢轶群;舒江波;;基于本体的构件库智能检索方法研究(英文)[J];湖南文理学院学报(自然科学版);2007年03期

8 王鑫;王英;;基于本体增量学习的主题爬行[J];长春工程学院学报(自然科学版);2010年04期

9 饶祎;刘鹏;;基于本体的GridGIS服务发现框架研究[J];地理信息世界;2007年04期

10 王芳;滕桂法;张玉新;任力生;马建斌;赵洋;;基于本体的农业问答语义管理系统设计与实现[J];河北农业大学学报;2008年05期

中国重要会议论文全文数据库 前10条

1 徐立恒;刘洋;来斯惟;刘康;田野;王渝丽;赵军;;基于多特征表示的本体概念挂载[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

4 毕鲁雁;焦宗夏;范圣韬;赵四军;;基于本体的机载机电系统故障诊断研究[A];第五届全国流体传动与控制学术会议暨2008年中国航空学会液压与气动学术会议论文集[C];2008年

5 张素智;李宝燕;樊得强;;面向用户和领域本体的Web信息采集系统[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年

6 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

7 胡金柱;舒江波;陈志伟;杜志强;窦桂琴;;基于本体构件的工作流检索研究[A];第四届中国软件工程大会论文集[C];2007年

8 徐惠;高志强;陆青健;朱万颖;;ORIGO:一种基于数字化图书馆资源的本体学习方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

9 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

10 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

中国博士学位论文全文数据库 前10条

1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年

2 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年

3 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年

4 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

5 唐素勤;面向语义Web的描述逻辑本体构建[D];中南大学;2011年

6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年

7 陈建辉;基于脑信息学的数据脑建模及其应用[D];北京工业大学;2011年

8 张杨;语义Web服务组合的可信性度量研究[D];重庆大学;2011年

9 袁侃;复杂系统的故障诊断及容错控制研究[D];南京航空航天大学;2010年

10 郭春芬;基于本体的工艺知识管理关键技术研究[D];山东科技大学;2011年

中国硕士学位论文全文数据库 前10条

1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年

2 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年

3 朴红吉;基于分布式多索引融合的专利信息检索研究[D];大连理工大学;2010年

4 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年

5 徐济成;面向农业领域的本体学习建模研究[D];安徽农业大学;2010年

6 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年

7 杜海波;本体在医疗信息检索系统中的应用研究[D];长春工业大学;2010年

8 刘小齐;可复用测试用例的分类与智能检索研究[D];华东理工大学;2011年

9 史磊峰;移动垂直搜索系统的研究[D];北京交通大学;2010年

10 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 李震;;移动垂直搜索:随时得到有用信息[J];中国传媒科技;2006年12期

3 吴劲,陈泽琳;基于部分匹配的XML文本文档向量检索模型[J];电子学报;2002年S1期

4 盛晓炜,江铭虎;基于Rough集约简算法的中文文本自动分类系统[J];电子与信息学报;2005年07期

5 崔莹莹;;垂直搜索:小搜索公司的活路[J];法人杂志;2006年03期

6 李智超;熊风;富羽鹏;马少平;;分布式大规模文本检索系统[J];广西师范大学学报(自然科学版);2007年02期

7 卢代军;夏学知;张子鹤;沙基昌;;目标信息的时效性分析[J];火力与指挥控制;2007年01期

8 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期

9 朱礼军,陶兰,刘慧;领域本体中的概念相似度计算[J];华南理工大学学报(自然科学版);2004年S1期

10 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期

中国重要会议论文全文数据库 前1条

1 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

中国硕士学位论文全文数据库 前3条

1 郑丽萍;本体映射的研究[D];山东科技大学;2005年

2 尹红丽;基于本体的个性化信息检索系统模型研究[D];山东大学;2006年

3 宋迪;基于用户偏好的搜索引擎的指标分析与评价[D];哈尔滨工业大学;2007年

【相似文献】

中国期刊全文数据库 前10条

1 庄芯;;风投押宝垂直搜索 各方巨头介入又添疑点[J];IT时代周刊;2008年01期

2 顾鹏尧;;让搜索引擎更好地服务于教育教学[J];科学24小时;2003年Z1期

3 陈新颜;垂直搜索引擎辨析[J];现代情报;2004年09期

4 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年32期

5 胡洁;丁宁;关静;曹福年;张磊;;基于“PUBMED+PDF”的医学垂直搜索引擎的实践[J];信息系统工程;2009年05期

6 一林;;垂直搜索:前进路上的喜与忧[J];互联网天地;2010年02期

7 牟思;;基于垂直搜索引擎的学校网站的研究与建设[J];中国教育技术装备;2011年21期

8 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期

9 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年31期

10 边凯;;你会搜索吗?[J];中国计算机用户;2007年23期

中国重要会议论文全文数据库 前3条

1 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年

中国重要报纸全文数据库 前10条

1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;[N];计算机世界;2010年

2 王艳;[N];中国旅游报;2000年

3 赛迪网 方刚;[N];中国计算机报;2000年

4 王靖;[N];人民日报海外版;2000年

5 记者 王浒;[N];中国旅游报;2009年

6 本报记者 王宏;[N];中国计算机报;2001年

7 徐瑾 张玉;[N];人民邮电;2009年

8 本报记者 王晓雁;[N];法制日报;2009年

9 记者 吴德群;[N];深圳特区报;2009年

10 本报记者 胡钰;[N];华夏时报;2009年

中国博士学位论文全文数据库 前5条

1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年

2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年

4 汲业;面向图像的垂直搜索引擎关键技术研究[D];大连海事大学;2013年

5 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年

中国硕士学位论文全文数据库 前10条

1 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年

2 齐鹏;垂直搜索引擎分类索引系统的设计与实现[D];大连海事大学;2010年

3 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年

4 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年

5 周佳庆;实时垂直搜索引擎数据抓取调度研究[D];浙江大学;2010年

6 华大年;手机产品信息垂直搜索引擎系统设计与开发[D];武汉理工大学;2011年

7 薛萍;基于教育领域的垂直搜索引擎的研究与实现[D];天津师范大学;2011年

8 冯效栋;垂直搜索引擎技术在网络舆情巡控中的研究与应用[D];中国海洋大学;2010年

9 张赢;个性化多媒体资源垂直搜索引擎技术研究[D];华东交通大学;2009年

10 李海升;垂直搜索引擎的研究与实现[D];西安电子科技大学;2009年


  本文关键词:基于领域本体的垂直搜索引擎页面排序算法的研究,,由笔耕文化传播整理发布。



本文编号:113263

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/113263.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e045f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com