当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于本体的新闻主题搜索研究

发布时间:2019-04-16 19:46
【摘要】:近年来,Internet发展迅速并已渗透到生活的各个角落,Internet上蕴藏着大量的各类新闻信息,传统的新闻获取方式受到极大的挑战,人们进入了一个“信息爆炸”、“新闻过剩”,而“新闻知识匮乏”的时代,通用搜索引擎在一定程度上解决了上述问题。由于Web的动态性和规模越来越大,通用搜索引擎索引数据库的索引逃逸子空间不断扩大,其查询接口也很难满足特定用户的查询请求。因此,新闻主题搜索引擎应运而生。 目前,Internet已成为人们获取新闻的重要来源,如何从大量的新闻网站中准确、快速地找到所需要的新闻已成为新闻搜索引擎的首要目标,为实现该目标,本文尝试在新闻主题搜索引擎中加入语义概念,试图通过本体在语义方面的强大表达能力并借助于局部上下文信息,来增强搜索引擎的语义理解能力及查询精度。 由新闻主题搜索引擎入手来研究专业搜索引擎,这种构想也会对专业搜索引擎的发展产生一定的影响。为实现上述目标,本文主要做了如下两方面的工作: 1.构建新闻领域本体。首先,,介绍了构建新闻领域本体的意义和策略,将软件工程学的思想融入到新闻领域本体的构建过程当中;然后,详细论述了领域本体的构建过程,并对每步都做了较详细的分析;最后,根据本文算法的需要,利用本体构建工具protégé3.3.1并参照其他领域本体的构建方法构建了一个简单的新闻领域本体。 2.设计并实现了新闻主题搜索引擎,详细介绍了该系统的功能及构成模块,给出了新闻主题搜索引擎的语义检索模型。将本文提出的基于本体和局部上下文分析的查询扩展方法应用于该系统,重点论述了查询扩展方法中的语义扩展、扩展词的筛选等关键技术。最后对实验的结果进行分析并加以总结,验证了该方法的有效性。
[Abstract]:In recent years, Internet has developed rapidly and has penetrated into every corner of life. Internet contains a large number of news information of all kinds, and the traditional way of obtaining news has been greatly challenged, and people have entered a "information explosion" and "news surplus." In the era of lack of news knowledge, the general search engine solved the above problems to a certain extent. Because of the dynamic and larger scale of Web, the index escape subspace of general search engine index database is expanding constantly, and its query interface is difficult to satisfy the query request of specific users. Therefore, news topic search engine emerges as the times require. At present, Internet has become an important source for people to obtain news. How to accurately and quickly find the required news from a large number of news websites has become the primary goal of news search engines, and in order to achieve this goal, This paper attempts to add semantic concepts to the news topic search engine and try to enhance the semantic understanding ability and query precision of the search engine by means of the strong semantic expression ability of ontology and local context information. From the news subject search engine to study the professional search engine, this concept will also have a certain impact on the development of professional search engine. In order to achieve the above-mentioned objectives, the following two aspects of work have been done in this paper: 1. Construct news domain ontology. Firstly, this paper introduces the significance and strategy of constructing news domain ontology, and integrates the idea of software engineering into the construction process of news domain ontology. Then, the construction process of domain ontology is discussed in detail, and every step is analyzed in detail. Finally, according to the need of this algorithm, a simple news domain ontology is constructed by using the ontology building tool Prod 茅 g 茅 3.3.1 and referring to other domain ontology construction methods. 2. A news topic search engine is designed and implemented. The function and composition module of the system are introduced in detail. The semantic retrieval model of news topic search engine is given. In this paper, the query extension method based on ontology and local context analysis is applied to the system, and the key technologies such as semantic extension, extension word selection and so on are discussed in detail. Finally, the experimental results are analyzed and summarized to verify the effectiveness of the method.
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 李文骏;崔志明;;基于搜索引擎的Deep Web数据源发现技术[J];计算机技术与发展;2008年08期

2 李莉;高庆狮;;一种基于语义单元的查询扩展方法[J];计算机科学;2008年02期

3 邹良群;周春雷;;基于搜索引擎的公开情报自动化搜集模型[J];电脑知识与技术;2008年26期

4 裴飞;洪宇;孙常龙;姚建民;朱巧明;;基于Web的查询扩展[J];电脑知识与技术;2011年06期

5 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期

6 ;关键词搜索[J];每周电脑报;2000年38期

7 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期

8 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期

9 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期

10 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期

相关会议论文 前10条

1 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

8 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

9 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年

10 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年

相关重要报纸文章 前10条

1 李一鑫;搜索排名的红与黑[N];财经时报;2007年

2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年

3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年

4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年

5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年

6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年

8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年

9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年

10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年

相关博士学位论文 前10条

1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

相关硕士学位论文 前10条

1 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

2 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

3 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

4 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

5 卢苇;基于双语翻译搜索引擎的智能用户接口的研究[D];武汉理工大学;2009年

6 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

7 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年

8 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

9 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

10 田生伟;基于涉农词典的搜索引擎的研究与实践[D];新疆大学;2004年



本文编号:2459046

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2459046.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户67481***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com