当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucence的个性化搜索引擎研究

发布时间:2018-12-16 07:50
【摘要】:针对通用搜索技术难以满足不同背景、不同目的和不同时期的用户查询请求的缺陷,提出一种基于Lucence实现用户兴趣驱动的个性化搜索引擎方法。从Cookie文件分析用户搜索兴趣,构造用户兴趣向量,驱动搜索引擎,产生用户关注度高的搜索结果。实验结果表明,该用户兴趣驱动的个性化搜索引擎能够搜索出用户感兴趣的搜索结果,与传统搜索引擎相比,检索准确率有一定的提高。
[Abstract]:A personalized search engine method based on Lucence is proposed to solve the problem that the general search technology is difficult to satisfy different background, different purpose and different period of user's query request. Analyzing the user's search interest from the Cookie file, constructing the user's interest vector, driving the search engine, and producing the search result with high user's attention. The experimental results show that the personalized search engine driven by the user's interest can search out the search results that the users are interested in, and the retrieval accuracy is improved compared with the traditional search engine.
【作者单位】: 南京工业大学电子与信息工程学院;
【基金】:江苏省高校自然科学基金资助项目(09KJB520006) 南京大学软件新技术国家重点实验室开放基金资助项目(KFKT2008B15)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前2条

1 张俊伟,张岭,马范援;提供个性化服务的搜索引擎页面排序算法[J];计算机工程;2003年19期

2 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期

【共引文献】

相关期刊论文 前10条

1 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期

2 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期

3 马哲,姚敏;一种改进的基于PATRICIA树的汉语自动分词词典机制[J];华南理工大学学报(自然科学版);2004年S1期

4 翟凤文;赫枫龄;左万利;;基于统计规则的交集型歧义处理方法[J];吉林大学学报(理学版);2006年02期

5 费洪晓;胡海苗;巩燕玲;;基于Hash结构的机械统计分词系统研究[J];计算机工程与应用;2006年05期

6 肖红;许少华;李欣;;具有三级索引词库结构的中文分词方法研究[J];计算机应用研究;2006年08期

7 王思力;张华平;王斌;;双数组Trie树算法优化及其应用研究[J];中文信息学报;2006年05期

8 李江波;周强;陈祖舜;;汉语词典的快速查询算法研究[J];中文信息学报;2006年05期

9 马志强;周长胜;杨娜;丁维;;基于中文搜索引擎的分词词典的设计与实现[J];铁路计算机应用;2006年12期

10 张培颖;李村合;;一种中文分词词典新机制——四字哈希机制[J];微型电脑应用;2006年10期

相关博士学位论文 前2条

1 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年

2 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年

相关硕士学位论文 前10条

1 马哲;垃圾邮件过滤系统的研究与实现[D];浙江大学;2005年

2 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年

3 李遂;通用电视节目管理平台[D];湖南大学;2005年

4 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年

5 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年

6 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年

7 姜鹏;基于双数组的分词词典研究与实现[D];大连理工大学;2006年

8 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年

9 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年

10 张波;个性化Web搜索系统研究[D];燕山大学;2006年

【二级参考文献】

相关期刊论文 前8条

1 左雄辉,糜麒;个性化搜索引擎研究[J];计算机工程与应用;2005年17期

2 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期

3 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期

4 韩彬斌,王培康;Web网页识别算法研究[J];情报学报;2001年01期

5 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期

6 山岚,徐耀;基于Agent的智能化专业信息采集系统[J];计算机工程与设计;2005年11期

7 张元馨,赵仲孟,沈钧毅;一种基于向量空间模型的个性化搜索引擎研究[J];微电子学与计算机;2003年11期

8 孙茂松,邹嘉彦;汉语自动分词研究中的苦干理论问题[J];语言文字应用;1995年04期

【相似文献】

相关期刊论文 前10条

1 汪翠红;;浅谈“个性化”搜索[J];电脑知识与技术(学术交流);2007年09期

2 王华火,罗键;Web环境中的HTTP状态管理[J];微型机与应用;2000年03期

3 段艳明;肖辉辉;;个性化元搜索引擎的研究[J];软件导刊;2009年07期

4 刘续;王q,

本文编号:2382018


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2382018.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6e44c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com