当前位置:主页 > 管理论文 > 移动网络论文 >

网站简约本体垂直搜索系统的设计与实现

发布时间:2018-03-09 17:38

  本文选题:本体库 切入点:垂直搜索引擎 出处:《计算机工程与应用》2017年19期  论文类型:期刊论文


【摘要】:针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。
[Abstract]:In the process of constructing a vertical search engine of ontology database for a single website, the human cost of collecting and arranging the thesaurus and its logical relationship is high, which leads to the maturity of the technical framework, while most of the search functions of the website are still based on character matching. This paper designs and develops a vertical search system based on the simple ontology library of website, which is lack of participle, query expansion and the ranking of the correlation degree of results, and it is very difficult to hit the relevant query content accurately. The system takes http: / / / data.cma.cn. cn. as an example. The ontology database of China Meteorological data Network is constructed by using prot 茅 g 茅 according to the navigation directory of the website. Based on the technical framework of Lucene engine, the objects and web pages in the ontology database are partitioned, and the ontology object index database and the web page index library are constructed. After segmenting the query content, the first extension is carried out in the ontology object index database, and the correlation degree of the extended result is calculated and sorted by using the TF-IDF correlation algorithm, which is regarded as the weight value of each extended ontology object. The weights are dynamically assigned to the objects extended by the Jena quadratic semantic analysis technology. Finally, all the keywords with weights are searched in the index database of the web pages, and the correlation of the results is calculated and sorted. The experimental results show that, The system is easy to build, can be extended for users, recommends related query content, and improves the precision and recall rate for website retrieval.
【作者单位】: 国家气象信息中心资料服务室;中国农业科学院植物保护研究所;列日大学生物技术学院;
【基金】:公益性行业(气象)科研专项(重大专项)(No.GYHY(QX)20150600-7) 第五届青年科技基金(No.NMICQJ201604)
【分类号】:TP391.3;TP393.092

【相似文献】

中国期刊全文数据库 前10条

1 卢敏;;垂直搜索——我专故我在[J];软件世界;2006年23期

2 陈诚;;基于云计算的智慧城市垂直搜索技术研究[J];软件产业与工程;2012年04期

3 白骏骄;;垂直搜索更贴近需求或引领搜索市场发展方向[J];世界电信;2013年05期

4 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期

5 刘策;;垂直搜索——电子商务领域的新秀[J];软件导刊;2006年11期

6 吴伟忠;崔建英;;基于时效性的垂直搜索及其应用[J];暨南大学学报(自然科学版);2007年03期

7 蔡恩泽;;垂直搜索的精细化功夫[J];互联网天地;2008年08期

8 蔡恩泽;;垂直搜索的精细化功夫[J];微电脑世界;2008年09期

9 周作涛;;垂直搜索在电子商务中的应用分析[J];陕西理工学院学报(自然科学版);2008年03期

10 章立;陈蜀宇;;一种针对商品价格进行实时垂直搜索的方法[J];重庆工学院学报(自然科学版);2008年10期

中国重要会议论文全文数据库 前2条

1 周明;刘晓华;蒋龙;Matt Scott;;利用网络挖掘技术建立英语学习平台[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

2 刘源;詹舒波;;基于Solr的行业垂直搜索平台的研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

中国重要报纸全文数据库 前3条

1 殷林;“垂直搜索”将成就电子商务新天地[N];中国商报;2007年

2 本报记者 林莉君;B2B商业搜索:垂直搜索是否迎来新拐点[N];科技日报;2011年

3 本报记者 刘燕;羽量级欧朋浏览器8.0的克制和低调[N];科技日报;2013年

中国博士学位论文全文数据库 前1条

1 管虎;普适环境下轻量级垂直搜索中数据挖掘理论研究[D];上海交通大学;2013年

中国硕士学位论文全文数据库 前10条

1 梅良;基于特定领域对象级垂直搜索中的对象抽取问题的研究[D];电子科技大学;2015年

2 肖剑;垂直搜索中一种高效稳定的数据抓取方法的研究与实现[D];南京大学;2014年

3 况雄剑;个性化时政信息搜索引擎的研究与实现[D];西安电子科技大学;2015年

4 费华辉;基于MongoDB的旅游垂直搜索系统的设计与实现[D];华中科技大学;2014年

5 吕昊;面向垂直搜索的聚焦爬虫研究及应用[D];浙江大学;2008年

6 易平;生活服务行业垂直搜索的设计与实现[D];暨南大学;2010年

7 宋国;面向分布式数据源的语义垂直搜索系统研究与实现[D];哈尔滨工业大学;2013年

8 刘金亮;汽车行业垂直搜索系统原型的设计与关键模块的实现[D];北京邮电大学;2008年

9 史磊峰;移动垂直搜索系统的研究[D];北京交通大学;2010年

10 雷洪;一个垂直搜索系统的设计与实现[D];中山大学;2012年



本文编号:1589561

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1589561.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ffd90***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com