当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种基于频繁项集的搜索引擎聚类浏览算法

发布时间:2018-11-09 13:15
【摘要】:搜索引擎的聚类浏览技术可以帮助用户更好地在搜索引擎返回的结果中定位自己感兴趣的信息。TS-FIC算法通过加工关联规则挖掘出来的频繁项集作为类标签,形成初始聚类,利用频繁项集之间的语义关系,把初始聚类组织成树结构。在形成最终聚类时,引入语义相似度作为计算类相似度的一个考量方面,最后利用一种新的排序方案把最终结果排序显示给用户。实验表明,该算法具有一定可行性,并在效率与聚类精度方面有不错表现。
[Abstract]:The clustering and browsing technology of search engine can help users to locate the information they are interested in better in the results returned by search engines. TS-FIC algorithm uses frequent itemsets mined by processing association rules as cluster labels to form initial clustering. Using the semantic relation between frequent itemsets, the initial clustering is organized into tree structure. When the final clustering is formed, semantic similarity is introduced as an aspect of computing class similarity. Finally, a new sorting scheme is used to display the final results to users. Experiments show that the algorithm is feasible and has good performance in efficiency and clustering accuracy.
【作者单位】: 福州大学数学与计算机科学学院;
【基金】:中科院软件所开放课题基金资助项目(SYSKF0701) 国家自然科学基金资助项目(61070062)
【分类号】:TP391.1

【共引文献】

相关期刊论文 前10条

1 段宏,张桂清,谭运猛;一种基于Web挖掘的信息自动分类系统[J];华中科技大学学报(自然科学版);2003年07期

2 王勋,刘君强,魏贵义;智能学习中的知识表示和知识聚类[J];计算机工程与应用;2003年07期

3 朱克斌,唐菁,杨炳儒;Web文本挖掘系统及聚类分析算法[J];计算机工程;2004年13期

4 梅馨,邢桂芬;文本挖掘技术综述[J];江苏大学学报(自然科学版);2003年05期

5 钱铁云,王元珍,冯小年;结合类频率的关联中文文本分类[J];中文信息学报;2004年06期

6 谌志群;张国煊;;文本挖掘与中文文本挖掘模型研究[J];情报科学;2007年07期

7 王勋,刘君强;基于文档聚类的Web辅助浏览研究[J];情报学报;2004年02期

8 王楠;基于聚类的全文检索系统后处理[J];情报杂志;2005年01期

9 王建会,申展,胡运发;一种实用高效的聚类算法[J];软件学报;2004年05期

10 王勋,费玉莲,魏贵义;基于智能学习的网络辅助浏览技术研究[J];计算机工程与设计;2003年02期

相关会议论文 前1条

1 曾依灵;许洪波;白硕;;改进的OPTICS算法及其在文本聚类中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

相关博士学位论文 前8条

1 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年

2 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年

3 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年

4 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

5 赵鹏;复杂网络与互联网个性化信息服务的研究[D];中国科学技术大学;2006年

6 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年

7 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年

8 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年

相关硕士学位论文 前10条

1 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年

2 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年

3 余媛芳;面向产品创新设计的知识获取研究[D];西北工业大学;2004年

4 徐永红;基于专题信息服务的智能搜索引擎技术研究[D];国防科学技术大学;2004年

5 张全力;面向产品设计的中文web文本信息处理研究[D];西北工业大学;2005年

6 郭国印;数据挖掘技术的研究及其在PLM中的应用[D];西北工业大学;2005年

7 屈晓健;数据仓库及其挖掘技术在企业CRM中的应用研究[D];西北工业大学;2005年

8 芦立华;基于后缀树的中文文本聚类算法研究[D];上海海事大学;2005年

9 田卫东;保定市防伪税控系统研究[D];天津大学;2005年

10 张炜玮;基于Web日志的用户访问模式挖掘的研究[D];武汉理工大学;2006年

【相似文献】

相关期刊论文 前10条

1 谢坤武;陈世强;毕晓玲;;关联规则发现中的聚类方法[J];计算机科学;2007年08期

2 陆如松;闪四清;;基于抽样策略的关联规则算法[J];大众科技;2006年02期

3 王波;王瀚波;;关联规则数据挖掘算法浅析[J];科技情报开发与经济;2006年19期

4 毛德梅;丁瑞国;;对数据挖掘中关联规则算法的比较研究[J];皖西学院学报;2006年05期

5 张志锋;邓璐娟;刘秀梅;;关联规则算法在邮政商函客户关系中的应用[J];计算机技术与发展;2008年12期

6 吴佳佳;;关联规则算法在高职教学评价中的应用[J];信息与电脑(理论版);2010年04期

7 范文建;戴齐;陈明;;基于粗糙集的关联规则算法的研究[J];福建电脑;2006年04期

8 刘凯;赵跃龙;;关联规则挖掘在医保稽查中的应用研究[J];科技信息(科学教研);2007年33期

9 曾志勇;;基于星型模型的关联规则挖掘方法[J];现代计算机(专业版);2007年11期

10 韩开来;柳炳祥;;关联规则在图书馆新书推荐中的研究[J];科技信息(学术研究);2007年34期

相关会议论文 前10条

1 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

2 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年

3 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

4 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 谢毓湘;栾悉道;吴玲达;文军;老松杨;;一种基于聚类的播音员镜头探测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

7 纪雅楠;魏爱敏;王爽;;关联规则算法在学生成绩分析中的应用[A];2010国际信息技术与应用论坛论文集[C];2010年

8 吴亚晶;狄增如;樊瑛;;基于资源分布矩阵的二分网聚类方法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年

9 赵晓煜;康锦江;;基于客户价值的客户聚类及特征分析方法[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年

10 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

相关重要报纸文章 前5条

1 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年

2 李海峰;优化无功管理 实现电网安全运行[N];国家电网报;2008年

3 王国定 宋瑞卿 王永亮;山西上市公司综合实力谁强?[N];山西日报;2001年

4 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年

5 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年

相关博士学位论文 前10条

1 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年

2 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年

3 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年

4 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年

5 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年

6 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年

7 王昱;考虑特征变量异质性的分类方法及其在风险决策中的应用研究[D];中国科学技术大学;2009年

8 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年

9 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年

10 郝晓丽;粒度格矩阵空间模型及其应用研究[D];太原理工大学;2009年

相关硕士学位论文 前10条

1 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年

2 倪乐央;基于非参数方法的我国城市化水平聚类分析[D];浙江工商大学;2007年

3 李国宇;基于J2EE的数据挖掘系统的构建及聚类技术研究[D];天津大学;2007年

4 吴孙丹;基于聚类的入侵检测方法的研究[D];华中科技大学;2007年

5 金燕;多时间序列数据流聚类算法研究[D];国防科学技术大学;2007年

6 步新玉;基于数据挖掘的智能入侵检测系统研究[D];西安电子科技大学;2009年

7 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年

8 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年

9 梁敏君;分形聚类分析在证券客户细分中的应用研究[D];合肥工业大学;2009年

10 杨俊杰;灰色聚类与灰靶决策的算法研究[D];厦门大学;2009年



本文编号:2320513

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2320513.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e756***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com