文本聚类研究综述
本文关键词:文本聚类研究综述
【摘要】:[目的 /意义]文本聚类技术是提高搜索引擎性能的有效方法,是对文本信息进行组织的有效手段。[方法 /过程]介绍了文本聚类的研究背景和研究内容,总结了引入本体技术的文本聚类研究,分析了文本聚类结果评价的几种指标,并对文本聚类的方法和结果评价进行了综述。[结果 /结论]文本聚类的应用领域将不断扩大,文本聚类技术将成为人工智能的一个重要研究课题。
【作者单位】: 福州大学经济与管理学院;
【关键词】: 文本聚类 本体 评价指标
【基金】:国家自然科学基金项目“中文领域本体学习及半自动构建方法研究”(项目编号:71201032)成果之一
【分类号】:TP391.1
【正文快照】: 0引言随着时代的进步和科技的发展,互联网上的信息非常丰富,成为全球最大的分布式信息库,网络正日益成为人们获取信息的主要途径,人们享受着互联网所带来的便捷和高效。目前,绝大多数的信息都表现为文本形式,如何在大量的文本中提取用户感兴趣的、潜在有用的信息是需要解决的
【参考文献】
中国期刊全文数据库 前1条
1 彭京;杨冬青;唐世渭;付艳;蒋汉奎;;一种基于语义内积空间模型的文本聚类算法[J];计算机学报;2007年08期
【共引文献】
中国期刊全文数据库 前10条
1 周鑫;郝志峰;蔡瑞初;温雯;;带噪声的文本聚类及其在反垃圾邮件中的应用[J];广西师范大学学报(自然科学版);2011年02期
2 符保龙;张爱科;;基于均值密度中心估计的k-means聚类文本挖掘方法[J];重庆邮电大学学报(自然科学版);2014年01期
3 吴启明;易云飞;;文本聚类综述[J];河池学院学报;2008年02期
4 康健辉;吴渝;郑继明;;基于向量空间模型的改进音频分类算法[J];河南师范大学学报(自然科学版);2008年06期
5 胡金柱;俞小娟;李琼;周毕吉;;基于规则库和聚类分析的复句短语字段的自动识别研究[J];华中师范大学学报(自然科学版);2008年02期
6 陈建超;胡桂武;杨志华;严桂夺;;基于全局性确定聚类中心的文本聚类[J];计算机工程与应用;2011年10期
7 金春霞;周海岩;;动态向量的中文短文本聚类[J];计算机工程与应用;2011年33期
8 唐果;陈宏刚;;基于BBS热点主题发现的文本聚类方法[J];计算机工程;2010年07期
9 艾伟;孙四明;张峰;;基于本体的Web文本挖掘与信息检索[J];计算机工程;2010年22期
10 朱连江;马炳先;赵学泉;;基于轮廓系数的聚类有效性分析[J];计算机应用;2010年S2期
中国博士学位论文全文数据库 前7条
1 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
2 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
3 刘刚;面向领域的软件需求一致性验证方法研究[D];哈尔滨工程大学;2008年
4 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年
5 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
6 朱朝勇;基于本体的知识库分类研究[D];中国科学技术大学;2013年
7 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
3 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
4 吴启纲;中文文本聚类算法的研究与实现[D];西安电子科技大学;2010年
5 崔弘扬;面向学科的文献资源聚类系统研究及应用[D];华中师范大学;2011年
6 谢凤宏;基于复杂网络理论的文本聚类和关键词提取方法研究[D];辽宁师范大学;2011年
7 闫先明;基于变精度粗糙集的网络隐蔽通道检测的研究[D];南京理工大学;2011年
8 俞文明;Web中文文本聚类研究[D];杭州电子科技大学;2009年
9 徐东亮;基于聚类分析的网络论坛舆情信息挖掘技术研究[D];哈尔滨工业大学;2010年
10 王燕;网站敏感信息监视系统设计与实现[D];解放军信息工程大学;2008年
【二级参考文献】
中国期刊全文数据库 前2条
1 赵军;金千里;徐波;;面向文本检索的语义计算[J];计算机学报;2005年12期
2 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
【相似文献】
中国期刊全文数据库 前10条
1 赵亚琴;周献中;;一种基于小生境遗传算法的中文文本聚类新方法[J];计算机工程;2006年06期
2 刘务华;罗铁坚;王文杰;;文本聚类技术的有效性验证[J];计算机工程;2007年01期
3 丁X;许侃;;基于文本聚类方法的我国科技管理研究领域的计量研究[J];科学学研究;2007年S1期
4 孙爱香;杨鑫华;;关于文本聚类有效性评价的研究[J];山东理工大学学报(自然科学版);2007年05期
5 丘志宏;宫雷光;;利用上下文提高文本聚类的效果[J];中文信息学报;2007年06期
6 吴启明;易云飞;;文本聚类综述[J];河池学院学报;2008年02期
7 李江华;杨书新;刘利峰;;基于概念格的文本聚类[J];计算机应用;2008年09期
8 赵文鹏;;浅谈文本聚类研究[J];企业家天地下半月刊(理论版);2009年02期
9 章成志;;文本聚类结果描述研究综述[J];现代图书情报技术;2009年02期
10 马娜;;文本聚类研究[J];电脑知识与技术;2009年20期
中国重要会议论文全文数据库 前10条
1 赵世奇;刘挺;李生;;一种基于主题的文本聚类方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王洪俊;俞士汶;苏祺;施水才;肖诗斌;;中文文本聚类的特征单元比较[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 胡吉祥;许洪波;刘悦;王斌;程学旗;;基于重复串的短文本聚类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
8 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
9 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
10 章成志;;基于多语文本聚类的主题层次体系生成研究1)[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年
中国博士学位论文全文数据库 前3条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
3 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 康健;基于Multi-agent和群体智能的藏文网络舆情管理研究[D];西南交通大学;2015年
2 张培伟;基于改进Single-Pass算法的热点话题发现系统的设计与实现[D];华中师范大学;2015年
3 郭士串;结合权重因子与特征向量的文本聚类研究与应用[D];江西理工大学;2015年
4 邵明来;中文文本聚类关键技术研究[D];广西大学;2015年
5 王恒静;基于词类和搭配的微博舆情文本聚类方法研究[D];江苏科技大学;2015年
6 吴洁洁;基于RI方法的文本聚类研究[D];南昌大学;2015年
7 樊兆欣;个性化新闻推荐系统关键技术研究与实现[D];北京理工大学;2015年
8 苏圣瞳;微博热点话题发现系统的设计与实现[D];复旦大学;2014年
9 孙东普;融合属性抽取的多粒度专利文本聚类研究[D];大连理工大学;2015年
10 张丽;一种中文文本聚类方法的研究[D];哈尔滨工程大学;2009年
,本文编号:739746
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/739746.html