基于用户查询关键词的网页去重方法研究
本文选题:网页去重 切入点:元搜索 出处:《现代图书情报技术》2008年07期
【摘要】:在研究传统的基于特征码去重算法的基础上,针对元搜索引擎中网页重复现象,提出一种基于用户查询关键词的网页去重方法,提高元搜索引擎检索质量,并且介绍算法的实现过程,通过实验验证算法的有效性。
[Abstract]:Based on the study of the traditional algorithm based on signature de-reduplication, a new method based on user search keywords is proposed to improve the retrieval quality of meta search engine. The implementation process of the algorithm is introduced, and the validity of the algorithm is verified by experiments.
【作者单位】: 河南工业大学信息科学与工程学院;
【分类号】:TP393.092
【参考文献】
相关期刊论文 前1条
1 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
【共引文献】
相关期刊论文 前1条
1 向晖;郭一平;王亮;;基于Lucene的中文字典分词模块的设计与实现[J];现代图书情报技术;2006年08期
相关博士学位论文 前4条
1 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
2 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
3 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
4 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
相关硕士学位论文 前10条
1 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
2 王倩倩;基于覆盖算法的中文垃圾邮件过滤[D];安徽大学;2007年
3 司广涛;基于最大熵模型的垃圾邮件过滤系统研究[D];苏州大学;2006年
4 陈欣;基于连通支配集的P2P搜索技术研究[D];山东科技大学;2006年
5 罗玫;基于LUCENE2.0的源代码搜索引擎架构的实现[D];西北工业大学;2007年
6 刘京会;基于ISG平台的定位服务系统的研究[D];对外经济贸易大学;2007年
7 董立;Web信息挖掘在公共信息安全中的应用[D];山东大学;2007年
8 柴宝杰;中文自动分词若干技术的研究[D];燕山大学;2007年
9 台德艺;基于特征权重算法的文本分类研究[D];合肥工业大学;2007年
10 严晓梅;基于网络的智能答疑系统的设计与实现[D];西北大学;2007年
【二级参考文献】
相关期刊论文 前10条
1 湛燕,陈昊,袁方,王熙照;基于中文文本分类的分词方法研究[J];计算机工程与应用;2003年23期
2 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
3 黄于蓝,王洪,徐端颐,贾惠波;搜索引擎技术的新发展—多元搜索引擎系统[J];计算机工程;2002年01期
4 张滨,晏蒲柳,李文翔,夏德麟;基于汉语句模的中文分词算法[J];计算机工程;2004年01期
5 王津涛,兰皓;面向主题元搜索引擎的设计与实现[J];计算机工程;2005年07期
6 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
7 李蓉,刘少辉,叶世伟,史忠植;基于SVM和k-NN结合的汉语交集型歧义切分方法[J];中文信息学报;2001年06期
8 雷西川,余靖维,卢晓玲;基于相邻知识的汉语自动分词系统研究[J];情报科学;1994年01期
9 盛宪锋,山岚;基于元搜索引擎的专业式智能网络信息检索系统[J];计算机工程与设计;2004年01期
10 亢临生,张永奎;基于标记的分词算法[J];山西大学学报(自然科学版);1994年03期
【相似文献】
相关期刊论文 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
4 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
5 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
6 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
7 猫女;;一些快速准确搜索资料的技巧[J];网络与信息;2009年02期
8 陈伟斌,张鑫;一种基于校园网的元搜索引擎的研究与设计[J];现代计算机;2005年03期
9 薛云,陈俊杰;Internet上有关元搜索引擎的研究与设计[J];电脑开发与应用;2003年04期
10 王津涛,兰皓;面向主题元搜索引擎的设计与实现[J];计算机工程;2005年07期
相关会议论文 前4条
1 诸葛建伟;袁春阳;;基于元搜索引擎实现被篡改网站发现与攻击者调查剖析[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
2 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 樊勇;郑家恒;张虎;;网页去重系统的设计与实现[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 马辉民;李卫华;;Web文档聚类系统的实现方法探析[A];第10届计算机模拟与信息技术会议论文集[C];2005年
相关重要报纸文章 前5条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 王旭;中文智能搜索引擎[N];计算机世界;2001年
3 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
4 应晓敏 窦文华;他山之石[N];计算机世界;2003年
5 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
相关博士学位论文 前1条
1 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
相关硕士学位论文 前10条
1 张俭恭;扩展元搜索引擎(EMSE)的系统设计[D];中国科学院研究生院(文献情报中心);2002年
2 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
3 李炎茗;元搜索引擎的现状研究与改进设计[D];华中师范大学;2002年
4 彭喜化;基于Agent的元搜索引擎结果优化研究[D];西南农业大学;2004年
5 潘友勇;面向元搜索引擎的Web页面排序优化技术研究与实现[D];华东理工大学;2012年
6 何玉菁;基于XML/Java的元搜索引擎的研究[D];广东工业大学;2004年
7 罗永莲;突发事件语料噪声排除与网页去重方法研究[D];山西大学;2005年
8 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
9 魏丽霞;基于文本结构的近似镜像网页去重[D];山西大学;2008年
10 樊德强;WEB个性化信息采集与管理关键技术研究[D];郑州轻工业学院;2011年
,本文编号:1659088
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1659088.html