基于网页聚类的搜索结果优化算法研究
[Abstract]:In view of the phenomenon that there are a large number of repeated web pages in search engine search results, a search results optimization algorithm based on clustering algorithm DBSCAN is proposed in this paper. The algorithm selects some of the top pages in the source search results, and carries out DBSCAN clustering of these pages according to the similarity of the pages. The redundant pages are eliminated to the maximum extent and the search results are optimized. The experimental results show that the algorithm can improve the comprehensiveness and accuracy of search results and improve the satisfaction of users using search engine.
【作者单位】: 浙江工业大学信息工程学院;
【基金】:浙江省自然科学基金资助项目(X105739)
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 方志坚;张瑞林;童小素;;搜索引擎综合分析[J];计算机工程与设计;2007年16期
【相似文献】
相关期刊论文 前10条
1 张语涵;孙劲光;苗锡奎;;基于改进的ISODATA算法彩色图像分割[J];计算机系统应用;2010年02期
2 高兵;邹启杰;;基于网格的聚类方法研究[J];软件工程师;2010年Z1期
3 刘庆峰;雷汝海;;基于微阵列数据分析的癌症诊断[J];中国科技论文在线;2010年02期
4 索红光;孙珊珊;王玉伟;梁玉环;;基于主题短语的搜索引擎结果聚类[J];计算机系统应用;2010年03期
5 彭宇;罗清华;彭喜元;;网络化测试体系中不确定性数据处理方法浅析[J];仪器仪表学报;2010年01期
6 谌德荣;宫久路;何光林;曹旭平;;高光谱图像全局异常检测RFS-SVDD算法[J];宇航学报;2010年01期
7 刘淑瑞;秦文珍;张聪;;基于数据挖掘技术的图书馆采购管理研究[J];重庆文理学院学报(自然科学版);2010年01期
8 张黎;逄涣利;王小虎;王佳;;一种共调控基因C均值模糊聚类算法[J];计算机工程与应用;2010年07期
9 黄荣顺;吴宏刚;李在铭;;采用动态分割与自适应滤波的弱小目标检测[J];计算机仿真;2010年02期
10 陈小冬;尹学松;林焕祥;;基于判别分析的半监督聚类方法[J];计算机工程与应用;2010年06期
相关会议论文 前10条
1 谭明;李成钢;石晓春;邱宏华;;基于特征的高分辨遥感影像道路提取[A];全国测绘科技信息网中南分网第二十四次学术信息交流会论文集[C];2010年
2 王兰莎;张国英;;HSV颜色空间及纹理特征映射方法研究[A];图像图形技术研究与应用(2010)[C];2010年
3 李兴阔;黄顺祥;周建梅;刘峰;;基于模糊聚类分析的POPs排放源分类研究[A];第三届中国智能计算大会论文集[C];2009年
4 李兴阔;黄顺祥;周建梅;刘峰;;基于模糊聚类分析的二恶英类排放源分类研究[A];第三届中国智能计算大会论文集[C];2009年
5 杨洋;杨新武;李玉鉴;;一种基于特征串比较的自动眉毛识别方法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
6 李芬;吴俊杰;张际春;;基于数据挖掘的移动通信业客户细分研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
7 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
8 庄瑞鑫;叶中行;;基于最小生成树的超度量聚类的若干案例分析[A];第三届中国智能计算大会论文集[C];2009年
9 刘未鹏;周俊生;黄书剑;陈家骏;;中文共指消解中的聚类全局优化[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 宋晓雷;王素格;李红霞;;面向特定领域产品评价对象自动识别研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
相关重要报纸文章 前4条
1 潘希;文本数据流聚类:在海量信息中挖掘真金[N];科学时报;2008年
2 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年
3 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年
4 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年
相关博士学位论文 前10条
1 万仁霞;数据流聚类算法研究[D];东华大学;2010年
2 陈应显;矿山三维空间信息集成系统及其应用研究[D];辽宁工程技术大学;2009年
3 孙申申;基于CT影像的肺结节检测与分割方法研究[D];东北大学 ;2009年
4 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
5 卢宏超;基于蛋白网络聚类的基因功能研究[D];中国科学院研究生院(计算技术研究所);2006年
6 智敏;基于内容的视频检索和浏览的关键技术[D];北京邮电大学;2006年
7 任永功;面向聚类的数据可视化方法及相关技术研究[D];东北大学;2006年
8 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
9 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
10 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
相关硕士学位论文 前10条
1 俞乐克;基于遗传编程的数据挖掘分类和聚类算法的研究与实践[D];华东师范大学;2010年
2 龚瑜;蚁群算法研究及其在Web挖掘聚类上的应用[D];华东师范大学;2010年
3 何焕;聚类技术在客户细分中的研究与应用[D];江西理工大学;2010年
4 高娟;基于K-means算法的文本聚类的研究与实现[D];江西理工大学;2010年
5 褚贵庆;基于聚类分析的洪水预报研究[D];浙江大学;2010年
6 武娜;视频搜索结果分析及其可视化方法研究与应用[D];东华大学;2010年
7 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年
8 曹永照;数据流聚类算法的研究[D];合肥工业大学;2009年
9 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年
10 吴林敏;针对非均匀数据集的DBSCAN过滤式改进算法[D];重庆大学;2009年
,本文编号:2462241
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2462241.html