当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种改进的FCM检索结果聚类算法研究

发布时间:2020-02-02 07:29
【摘要】:针对检索引擎返回的查询结果数量巨大,用户难以在较短的时间获取有用的信息,传统FCM聚类算法的距离无法完全准确描述文本间的相似程度,本文提出了一种新的文本间的距离定义,改进了模糊C均值聚类(FCM)聚类算法,利用新改进的算法对搜索引擎返回的结果进行聚类,方便了用户查询。实验证明了算法的可行性与有效性。

【参考文献】

相关期刊论文 前5条

1 龚静;曾建一;;文本聚类中的特征选择方法[J];吉首大学学报(自然科学版);2008年02期

2 赵亚琴;周献中;;一种基于小生境遗传算法的中文文本聚类新方法[J];计算机工程;2006年06期

3 任江涛;孙婧昊;施潇潇;黄焕宇;印鉴;;一种用于文本聚类的改进的K均值算法[J];计算机应用;2006年S1期

4 宋韶旭;李春平;;基于非对称相似度的文本聚类方法[J];清华大学学报(自然科学版);2006年07期

5 冯少荣;;一种提高文本聚类算法质量的方法[J];同济大学学报(自然科学版);2008年12期

相关博士学位论文 前1条

1 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年

【共引文献】

相关期刊论文 前10条

1 张娇;裘国永;张奇;;基于二分K均值的SVM决策树的高维数据分类方法[J];赤峰学院学报(自然科学版);2012年07期

2 史旗凯;郭菊娥;;基于SMA信息抽取的主题诊断研究[J];管理工程学报;2010年01期

3 于海;陈海雷;左万利;;小生境免疫算法在中文文本聚类中的应用[J];广西师范大学学报(自然科学版);2008年01期

4 吴晓琴;陈圣兵;何立新;;改进遗传算法在文本聚类中的应用研究[J];巢湖学院学报;2013年03期

5 熊志斌;朱剑锋;王冬;;K-means聚类算法的研究和应用[J];电脑编程技巧与维护;2014年08期

6 冯少荣;肖文俊;;基于语义距离的高效文本聚类算法[J];华南理工大学学报(自然科学版);2008年05期

7 刘艳丽;刘希云;;一种基于密度的K-均值算法[J];计算机工程与应用;2007年32期

8 贾燕花;徐蔚鸿;;K-means聚类和支持向量机结合的文本分类研究[J];计算机工程与应用;2010年22期

9 陈建超;胡桂武;杨志华;严桂夺;;基于全局性确定聚类中心的文本聚类[J];计算机工程与应用;2011年10期

10 唐果;陈宏刚;;基于BBS热点主题发现的文本聚类方法[J];计算机工程;2010年07期

相关博士学位论文 前8条

1 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年

2 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年

3 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年

4 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年

5 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年

6 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年

7 李孝忠;不确定变量间的距离和相似度研究[D];天津大学;2009年

8 陈晓美;网络评论观点知识发现研究[D];吉林大学;2014年

相关硕士学位论文 前10条

1 吴启纲;中文文本聚类算法的研究与实现[D];西安电子科技大学;2010年

2 白瑾;基于群体特性的搜索方法研究[D];武汉理工大学;2011年

3 徐德;关于互联网文本数据挖掘的一些关键技术研究[D];电子科技大学;2011年

4 唐洪林;基于多阶段聚类支持向量机在入侵检测中的研究与实现[D];成都理工大学;2011年

5 沈杰;基于蚁群算法的中文文本聚类研究[D];杭州电子科技大学;2009年

6 邓君;基于数据流的僵尸网络检测系统设计与实现[D];哈尔滨工业大学;2010年

7 孟庆富;生物医学多文档自动文摘系统设计与实现[D];哈尔滨工业大学;2010年

8 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年

9 杨慧洁;邮件通联关系网络中重要节点及社团发现技术研究[D];解放军信息工程大学;2010年

10 李超;基于Web的实例知识条目自动构建方法[D];哈尔滨工业大学;2010年

【二级参考文献】

相关期刊论文 前10条

1 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期

2 李凡,林爱武,陈国社;一种基于VSM文本分类系统的设计与实现[J];华中科技大学学报(自然科学版);2005年03期

3 姜宁,史忠植;文本聚类中的贝叶斯后验模型选择方法[J];计算机研究与发展;2002年05期

4 王琦,唐世渭,杨冬青,王腾蛟;基于DOM的网页主题信息自动提取[J];计算机研究与发展;2004年10期

5 刘挺,王开铸;基于篇章多级依存结构的自动文摘研究[J];计算机研究与发展;1999年04期

6 李蕾;王劲林;白鹤;胡晶晶;;基于FFT的网页正文提取算法研究与实现[J];计算机工程与应用;2007年30期

7 于满泉,陈铁睿,许洪波;基于分块的网页信息解析器的研究与设计[J];计算机应用;2005年04期

8 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期

9 刘远超;王晓龙;徐志明;关毅;;文档聚类综述[J];中文信息学报;2006年03期

10 韩先培;刘康;赵军;;基于布局特征与语言特征的网页主要内容块发现[J];中文信息学报;2008年01期

相关博士学位论文 前1条

1 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年

相关硕士学位论文 前1条

1 王t熺,

本文编号:2575647


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2575647.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c34f2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com