一种基于形式概念分析的Web文档标签聚类方法
本文关键词:一种基于形式概念分析的Web文档标签聚类方法
【摘要】:针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。
【作者单位】: 西华大学档案馆;西华大学数学与计算机学院;77538部队;
【关键词】: Web搜索结果组织 文档聚类 形式概念分析
【基金】:国家自然科学基金项目(61271413) 教育部“春晖计划”项目(12226531) 四川省人事厅学术与技术带头人培养计划(12226463)
【分类号】:TP391.1
【正文快照】: 0引言搜索引擎能够帮助用户在海量的互联网资源中获取有用信息。然而,现有搜索引擎返回的搜索结果文档数目非常庞大,要从这么多的结果中找到有用信息,有时显得很困难。如何满足不同类型用户的不同需要,办法之一就是对搜索结果进行合理组织。Hearst等[1]的研究已经证明了“聚
【参考文献】
中国博士学位论文全文数据库 前1条
1 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
【共引文献】
中国期刊全文数据库 前6条
1 刘炜;陈俊杰;;元搜索引擎中的推理技术[J];广西师范大学学报(自然科学版);2007年04期
2 谢春芝;杜亚军;;基于进化论观点的概念格构建算法[J];广西师范大学学报(自然科学版);2010年01期
3 陈俊杰;刘炜;;一种基于本体的个性化模式库建模方法[J];计算机研究与发展;2007年07期
4 刘炜;李舟军;;一种基于移动服务器端的树图建模方法[J];计算机科学;2011年04期
5 赵思佳;尹婷;;基于规则引擎的个性化主题网页爬虫的研究[J];计算机技术与发展;2011年03期
6 黄晓丹;王粉花;王志良;;情感决策的智能家居虚拟人路径规划[J];智能系统学报;2010年04期
中国博士学位论文全文数据库 前2条
1 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
2 王春元;公共网络信息系统安全管理的研究[D];合肥工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈文斐;基于形式概念分析的中文网页分类研究[D];西华大学;2011年
2 赵思佳;基于规则引擎的个性化网页爬虫研究[D];中南大学;2010年
3 唐俊;基于概念格的个性化信息检索研究[D];西华大学;2006年
4 项磊;搜索引擎中初始URLS优化研究[D];西华大学;2007年
5 董占兵;基于形式概念分析的主题搜索策略研究[D];西华大学;2007年
6 王竞;基于形式概念分析的Web搜索结果聚类方法的研究[D];西华大学;2008年
7 李新春;基于WordNet的概念格语义匹配算法及其在搜索引擎上的应用[D];西华大学;2008年
8 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年
9 黄少林;基于用户兴趣分析的个性化搜索引擎研究[D];首都师范大学;2009年
10 杨月奎;基于语义的主题爬行方向研究[D];西华大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 何学锋,彭超群,张曾荣;科技期刊7项重要计量指标间的相互关系[J];编辑学报;2003年06期
2 王红梅,朱洪秀,王凌;对中文搜索引擎未来发展的探讨[J];东北电力学院学报;2001年04期
3 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期
4 管惠维;基于Transputer的逻辑程序解释器的设计与实现[J];计算机研究与发展;1995年02期
5 丁承,邵志清;集中式搜索引擎的设计与开发[J];计算机工程;2002年02期
6 肖诗源,叶俊,刘贤德;一种基于Agent的分布式搜索引擎[J];计算机工程;2002年07期
7 徐俊萍,翟玉庆;基于Agent的个性化信息服务技术的研究[J];计算机工程与科学;2002年03期
8 张汛涞;搜索引擎的设计剖析[J];计算机工程与科学;2002年04期
9 陈志忠,陈肇雄,高庆狮;通用的自然语言词法分析机制[J];计算机学报;1991年02期
10 张廷华;Web元搜索引擎的改进[J];计算机应用;2002年02期
【相似文献】
中国期刊全文数据库 前10条
1 苗茹;沈夏炯;;概念格经典算法对比[J];福建电脑;2007年03期
2 蒋平;任胜兵;林鹃;;形式概念分析在软件工程中的应用[J];计算机技术与发展;2008年04期
3 郑珂;李涵;;基于形式概念分析的本体构建方法研究[J];福建电脑;2011年02期
4 苗茹;沈夏炯;;概念格中的规则提取[J];光盘技术;2006年01期
5 柴玉梅;杨冉;王黎明;;基于快速形式概念集构造的分类规则挖掘算法[J];烟台大学学报(自然科学与工程版);2009年03期
6 曲开社;阎俊霞;翟岩慧;;GM偏序图的构建和基于GM偏序图的规则提取[J];计算机工程与应用;2007年36期
7 苗茹;沈夏炯;胡小华;;概念格上无冗余关联规则的提取算法NARG[J];计算机工程;2009年22期
8 王u&菁;陈震;;一种基于概念格的关联规则挖掘算法[J];计算机工程与应用;2007年28期
9 高峰;何伟;;基于形式概念分析和本体的搜索引擎设计思考[J];中央民族大学学报(自然科学版);2009年S1期
10 马骏;沈夏炯;刘宗田;;基于三维空间的概念格自动布局[J];计算机科学;2006年05期
中国重要会议论文全文数据库 前10条
1 唐国瑜;夏云庆;张民;郑方;;基于跨语言广义向量空间模型的跨语言文档聚类方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 赵传申;杨明;孙志挥;;基于概念格的分布多库规则发现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 汤志钢;胡学钢;简宋全;;量化概念格研究[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
4 何超;程学旗;郭嘉丰;;基于层次概念格的分面导航[A];第六届全国信息检索学术会议论文集[C];2010年
5 周水庚;孙敬宇;胡运发;;一种文档聚类新方法[A];第十六届全国数据库学术会议论文集[C];1999年
6 伍赛;杨冬青;韩近强;张铭;王文清;冯英;;WCM:一种基于单词相关度的文档聚类新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 赵奕;施鹏飞;;一种快速的概念格构造方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
8 李勃;姚青;;一种基于概念格挖掘规则产生集的算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 覃海生;韦海兰;李新华;;基于概念格的Web测试在廉租住房系统中的应用研究[A];广西计算机学会2010年学术年会论文集[C];2010年
10 朱秋云;张琪;姬朝阳;陈亮;魏苑琦;朱绍文;;一种基于概念格的关联规则对半查找算法设计[A];2005年中国智能自动化会议论文集[C];2005年
中国重要报纸全文数据库 前1条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 刘铭;大规模文档聚类中若干关键问题的研究[D];哈尔滨工业大学;2010年
2 师智斌;高性能数据立方体及其语义研究[D];北京交通大学;2010年
3 王玮;基于概念格的关联规则挖掘及变化模式研究[D];山东大学;2012年
4 秦昆;基于形式概念分析的图像数据挖掘研究[D];武汉大学;2004年
5 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
6 陈湘;基于基集和概念格的数据挖掘方法研究[D];电子科技大学;2011年
7 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
8 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
9 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
10 余远;基于形式概念分析分类规则挖掘的关键问题研究[D];中国矿业大学(北京);2009年
中国硕士学位论文全文数据库 前10条
1 赵虹;基于概念格的关联规则挖掘研究[D];大连海事大学;2007年
2 刘树鹏;基于概念格的本体合并方法与技术的研究[D];大连海事大学;2010年
3 王培培;基于区别度概念格的关联规则挖掘算法设计[D];河南大学;2010年
4 赵文兵;基于概念格及其扩展模型的数据挖掘研究[D];合肥工业大学;2002年
5 臧国轻;一种基于深度优先的概念格并行构造模型[D];河南大学;2008年
6 王德兴;基于量化概念格的关联规则挖掘模型研究[D];合肥工业大学;2003年
7 张玉红;基于概念格扩展模型的分类问题研究[D];合肥工业大学;2004年
8 孟凡宇;软件再工程中的类层次重构与简化[D];吉林大学;2005年
9 李新春;基于WordNet的概念格语义匹配算法及其在搜索引擎上的应用[D];西华大学;2008年
10 安广伟;形式背景核的有限性研究与算法实现[D];河南大学;2006年
,本文编号:753308
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/753308.html