网络检索结果聚类研究综述
本文关键词:网络检索结果聚类研究综述 出处:《情报理论与实践》2015年10期 论文类型:期刊论文
【摘要】:网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优化聚类数K以及生成重叠聚类等;后者的改进主要有优化类计分运算、优化类合并运算、数据结构优化、候选标签选择以及基于语义的优化等。在对相关研究进行综述的基础上探讨了检索结果聚类面临的问题和未来的发展方向。
【作者单位】: 南京大学信息管理学院;
【基金】:国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”(项目编号:12&ZD221) 中国科学技术信息研究所“大数据环境下的人机交互研究”课题的资助
【分类号】:G252.7;G353.1
【正文快照】: 面对互联网上的海量信息,用户借助搜索引擎获得的结果中只有极少部分与需求相关。对此,学界提出了不同的改进策略。一是检索结果的多样化(Diversification)[1]。多样化不仅考虑文档与查询的相关性,还将文档间的不相似性作为排序的指标,试图从检索文档集层面优化检索结果的排序
【参考文献】
中国期刊全文数据库 前6条
1 夏斌;徐彬;;基于超链接信息的搜索引擎检索结果聚类方法研究[J];电脑开发与应用;2007年05期
2 张刚;刘悦;郭嘉丰;程学旗;;一种层次化的检索结果聚类方法[J];计算机研究与发展;2008年03期
3 张健沛,刘洋,杨静,代坤;搜索引擎结果聚类算法研究[J];计算机工程;2004年05期
4 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[J];中文信息学报;2009年02期
5 ;ISTC: A New Method for Clustering Search Results[J];Wuhan University Journal of Natural Sciences;2008年04期
6 吴夙慧;成颖;郑彦宁;潘云涛;;K-means算法研究综述[J];现代图书情报技术;2011年05期
【共引文献】
中国期刊全文数据库 前10条
1 贾荣飞;金茂忠;王晓博;;基于用户查询日志的查询聚类[J];北京航空航天大学学报;2010年04期
2 于洪;谌强;;一种结合K-Means的层次化的搜索结果聚类方法[J];重庆邮电大学学报(自然科学版);2010年03期
3 刘文婷;滕奇志;;后缀树聚类在专用搜索引擎中的应用研究与改进[J];成都信息工程学院学报;2010年03期
4 夏斌;徐彬;;基于超链接信息的搜索引擎检索结果聚类方法研究[J];电脑开发与应用;2007年05期
5 秦岳;毛征;孙乐公;齐南;彭超;;慢运动背景下的实时运动目标检测算法研究[J];国外电子测量技术;2011年12期
6 熊志斌;朱剑锋;王冬;;K-means聚类算法的研究和应用[J];电脑编程技巧与维护;2014年08期
7 卢仁猛;;检索结果聚类算法研究综述[J];计算机光盘软件与应用;2014年18期
8 姚丽君;赵磊;;基于改进的K-means聚类算法在图像分割中的研究[J];计算机光盘软件与应用;2014年20期
9 郎福通;王鹏;;基于MapReduce的网格化优化CURE算法的实现[J];成都信息工程学院学报;2014年06期
10 刘宏志;韩福霞;;基于云模型和K-means聚类的蝙蝠优化算法[J];广西民族大学学报(自然科学版);2014年04期
中国重要会议论文全文数据库 前1条
1 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
2 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
3 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
4 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
5 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年
6 孔维梁;协同过滤推荐系统关键问题研究[D];华中师范大学;2013年
7 刘钰峰;异构信息网络检索技术研究[D];湖南大学;2014年
8 何明贵;可视化搜索引擎模型与方法研究[D];武汉大学;2010年
9 冯时;面向网络舆情分析的观点挖掘关键技术研究[D];东北大学;2011年
10 郑舒阳;基于驾驶意图识别与行驶工况识别的地下矿车控制策略[D];北京科技大学;2015年
中国硕士学位论文全文数据库 前10条
1 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
2 吴代文;基于Lucene的二次全文检索系统设计与实现[D];西安电子科技大学;2009年
3 邹浩;基于B/S+C/S结构的高校图书管理系统[D];电子科技大学;2011年
4 俞文明;Web中文文本聚类研究[D];杭州电子科技大学;2009年
5 刘龙海;基于成对约束的半监督文本聚类算法研究[D];重庆大学;2011年
6 刘文静;基于标签词抽取的搜索结果聚类研究[D];北京邮电大学;2012年
7 张玉新;面向专题的信息搜索与过滤技术研究[D];国防科学技术大学;2005年
8 张晓卫;Web全文信息检索系统的研究与实现[D];苏州大学;2006年
9 周登朋;搜索引擎搜索结果的聚类研究[D];上海交通大学;2007年
10 高少琛;基于查询拓展和聚类技术的资源检索系统的研究与应用[D];上海交通大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 牛琨;张舒博;陈俊亮;;融合网格密度的聚类中心初始化方案[J];北京邮电大学学报;2007年02期
2 刘立平,孟志青;一种选取初始聚类中心的方法[J];计算机工程与应用;2004年08期
3 张忠平;王爱杰;柴旭光;;简单有效的确定聚类数目算法[J];计算机工程与应用;2009年15期
4 张健沛,刘洋,杨静,代坤;搜索引擎结果聚类算法研究[J];计算机工程;2004年05期
5 蒋盛益;李庆华;;一种增强的k-means聚类算法[J];计算机工程与科学;2006年11期
6 李锁花;孙志挥;周晓云;;基于特征向量的分布式聚类算法[J];计算机应用;2006年02期
7 张文明;吴江;袁小蛟;;基于密度和最近邻的K-means文本聚类算法[J];计算机应用;2010年07期
8 张逸清;刘文才;;聚类数的确定[J];计算机与数字工程;2007年02期
9 巩敦卫;蒋余庆;张勇;周勇;;基于微粒群优化聚类数目的K-均值算法[J];控制理论与应用;2009年10期
10 王志梅,张俊林,李秋山;Web检索结果快速聚类方法的研究与实现[J];计算机工程与设计;2004年12期
【相似文献】
中国期刊全文数据库 前10条
1 蔡孟欣;从隐蔽网络看网络检索行为[J];图书馆学刊;2005年05期
2 赵冬梅;自然科学学术资源分布及其网络检索[J];图书馆学研究;2005年01期
3 赵春艳;;网络检索中的数据挖掘技术理论与应用[J];情报探索;2006年01期
4 毛晓燕;;用户满意度指数在网络检索系统中的应用[J];情报科学;2007年07期
5 洪跃;崔海峰;;网络检索技术学术论坛浅析[J];全国新书目;2007年19期
6 陈继红;李文侠;;网络检索系统的新发展[J];图书情报工作;2009年S1期
7 甘泉;;网络检索行为心理过程分析[J];青年记者;2010年17期
8 高振清;;网络检索系统的研究[J];信息安全与技术;2013年11期
9 王燕平;;新世纪戏剧资料的网络检索[J];剧影月报;2009年01期
10 文丽;谈医药信息资源的网络检索方法[J];齐齐哈尔医学院学报;2004年02期
中国重要会议论文全文数据库 前3条
1 刘德章;;口腔医学网络检索[A];FDI、CSA临床口腔进展学术会议论文汇编[C];1999年
2 孔琪颖;蔡斐;张利平;徐晓;;使用网络检索系统辨别汉字[A];2008年第四届中国科技期刊发展论坛论文集[C];2008年
3 王保金;刘乘翔;;我国农民工体育发展问题的探讨[A];第二届全民健身科学大会论文摘要集[C];2010年
中国重要报纸全文数据库 前1条
1 扬帆;快、准、全 网络检索的关键[N];光明日报;2001年
中国硕士学位论文全文数据库 前3条
1 甘泉;网络检索过程及其心理[D];华中科技大学;2011年
2 张鑫;网络检索系统的设计与实现[D];电子科技大学;2012年
3 代鑫;针对特定领域的网络检索系统的设计与实现[D];上海交通大学;2010年
,本文编号:1312503
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1312503.html