搜索引擎查询日志中的聚类算法研究
本文选题:网络数据挖掘 + 搜索引擎查询日志 ; 参考:《计算机应用与软件》2007年03期
【摘要】:近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比。
[Abstract]:In recent years, with the rapid development of network technology of data mining, how to find useful information in the query log has become an important research direction from the search engine are discussed in detail. First proposed by Beeferman in search engine query agglomerative clustering algorithm and the influence of noise on the algorithm of the log data, pointed out a mistake improvement the algorithm in Chan, finally proposed an improved algorithm, and through simulation experiments on several different algorithms were compared.
【作者单位】: 上海大学计算机工程与科学学院 上海大学计算机网络中心 上海大学计算机工程与科学学院
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 陶跃华,陈丽萍,王泳;聚类分析在搜索引擎中的应用[J];计算机工程与应用;2003年21期
【共引文献】
相关期刊论文 前1条
1 罗金增;;基于模糊聚类的个性化Web信息检索系统研究[J];电脑知识与技术;2005年35期
相关博士学位论文 前1条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
相关硕士学位论文 前2条
1 潘玉奇;基于聚类分析的水污染监测系统的应用研究[D];山东大学;2005年
2 宋春芳;基于缓冲的XML语义检索系统研究与设计[D];山东大学;2007年
【二级参考文献】
相关期刊论文 前1条
1 陶跃华,孙茂松;搜索引擎中相关性反馈技术[J];情报理论与实践;2001年04期
【相似文献】
相关会议论文 前3条
1 张勇斌;梁荣华;马杰;马玉书;;神经网络数据挖掘聚类优化算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 马杰;胡海峰;马玉书;;基于人工神经网络的数据挖掘工具[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 马杰;刘月田;胡海峰;马玉书;;具有多种神经网络模型的数据挖掘工具[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
相关硕士学位论文 前7条
1 李野;基于GSM网络数据挖掘分析系统的研究与实现[D];北京邮电大学;2011年
2 高岩;基于社会网络分析方法的网络数据挖掘[D];吉林大学;2012年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 赵帆;基于复杂网络数据挖掘的个性化电子商务推荐系统研究[D];中南民族大学;2011年
5 马井刚;面向复杂网络的可视化分析工具的设计与实现[D];北京邮电大学;2010年
6 常诚;基于SAF模型的社会网络数据挖掘[D];北京邮电大学;2012年
7 杨志放;移动网络挖掘分析系统中ETL的研究与实现[D];北京邮电大学;2012年
,本文编号:1739985
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1739985.html