文本聚类研究知识图谱分析
本文关键词:文本聚类研究知识图谱分析
【摘要】:利用词频分析、共词分析、聚类分析、多维尺度分析,绘制我国2005—2010年间文本聚类研究的知识图谱,得出领域研究结构,结合关键词粘合力,归纳出该领域四个类团研究群:相似度研究、向量空间模型、搜索引擎、Web文本挖掘。
【作者单位】: 华南师范大学经济与管理学院;华南师范大学物理与电信工程学院;
【关键词】: 文本聚类 知识图谱 共词分析 多元统计分析
【基金】:广州市科技计划项目(2011J4300046)
【分类号】:TP181
【正文快照】: 1引言文本聚类(Text clustering)是指利用聚类分析使得同类的文档相似度较大,而不同类的文档相似度较小,它是一种无监督的机器学习方法,已经成为文本信息有效地组织、信息过滤、信息推荐、摘要和导航的重要手段,为越来越多的研究人员所关注。本文基于共词分析对2005年至2010年
【参考文献】
中国期刊全文数据库 前9条
1 耿焕同,陈少军;一种基于传统VSM和词共现概念的中文文本聚类的研究[J];安徽师范大学学报(自然科学版);2005年01期
2 魏瑞斌;;基于关键词的情报学研究主题分析[J];情报科学;2006年09期
3 钟伟金;李佳;;共词分析法研究(二)——类团分析[J];情报杂志;2008年06期
4 钟伟金;李佳;杨兴菊;;共词分析法研究(三)——共词聚类分析法的原理与特点[J];情报杂志;2008年07期
5 李佳;;核心词在共词聚类结果分析的作用研究[J];情报杂志;2009年12期
6 唐明珠;张远平;杨佳;;概念相似度在文本模糊聚类中的应用[J];计算机工程与设计;2008年03期
7 梁秀娟;;科学知识图谱研究综述[J];图书馆杂志;2009年06期
8 钟伟金;;共词聚类分析法的类团实例研究——对肿瘤治疗热点主题的分析[J];中华医学图书情报杂志;2009年02期
9 李佳;;共词矩阵在聚类结果分析中的作用[J];中华医学图书情报杂志;2009年04期
【共引文献】
中国期刊全文数据库 前10条
1 赵卓宁;敬枫蓉;肖天贵;;国内气象服务研究中的公共气象服务主题分析[J];成都信息工程学院学报;2012年01期
2 钱澄;李刚;;国内近十年档案网站研究的核心问题与热点分析——基于2000-2011年学术文献共词分析[J];档案与建设;2012年05期
3 陈瑜林;;我国远程教育主要研究领域演变——基于远程教育类期刊论文关键词的分析[J];中国远程教育;2012年06期
4 陈瑜林;;我国教育技术学博士学位论文元分析[J];电化教育研究;2011年07期
5 田时中;田家华;张光进;;基于论文词频分析的中国低碳经济研究评价[J];国土资源科技管理;2012年01期
6 许振亮;郭晓川;;国际技术创新研究前沿的知识图谱透视[J];管理学报;2011年05期
7 陈瑜林;;我国教育技术主要研究领域的历史演进——基于CNKI“两刊”关键词、主题词的类团分析[J];电化教育研究;2012年08期
8 赵蓉英;吴胜男;;基于战略坐标图的我国馆藏资源研究主题分析[J];图书与情报;2013年02期
9 那一沙;袁玫;杜修平;;基于词频分析和共词聚类的高职教育热点问题的研究[J];中国农机化学报;2013年03期
10 李镜镜;张志强;;国内电子书研究的文献计量分析[J];出版科学;2013年04期
中国重要会议论文全文数据库 前4条
1 许振亮;;国际技术创新研究前沿领域的知识可视化分析——作者共被引网络与聚类分析视角[A];第七届中国科技政策与管理学术年会论文集[C];2011年
2 邱均平;楼雯;;我国索引研究二十年回顾与展望——纪念中国索引学会成立20周年[A];2011年中国索引学会年会暨成立二十周年庆典论文集[C];2011年
3 金殷玉;曹玲;;基于知识图谱的国际应急管理研究可视化分析[A];风险分析和危机反应的创新理论和方法——中国灾害防御协会风险分析专业委员会第五届年会论文集[C];2012年
4 郝悦星;李冬梅;刘禹;;面向专业领域的谱系型知识检索方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
中国博士学位论文全文数据库 前10条
1 王琪;西方现代体育科学发展史论[D];福建师范大学;2011年
2 杨志勇;营销学科图谱[D];东华大学;2011年
3 陈立新;力学期刊群的内外关系与学科结构[D];大连理工大学;2008年
4 许振亮;国际技术创新研究前沿与学术群体可视化分析[D];大连理工大学;2010年
5 秦长江;基于科学计量学共现分析法的中国农史学科知识图谱构建研究[D];南京农业大学;2009年
6 马明;武警远程医学创新发展若干重要问题研究[D];中国人民解放军军事医学科学院;2010年
7 解小刚;中印上市医药公司核心竞争力评价研究[D];天津大学;2012年
8 邵红芳;基于知识网络的肿瘤学衍生与发展研究[D];山西医科大学;2013年
9 王富强;空间知识地图构建理论和方法研究[D];解放军信息工程大学;2013年
10 郝心宁;生物育种领域知识结构与知识演化研究[D];中国农业科学院;2013年
中国硕士学位论文全文数据库 前10条
1 秦璇;协同知识结构序化测度模型及演化规律研究[D];大连理工大学;2010年
2 李颖;国内竞争情报研究演进态势—共词分析视角[D];湘潭大学;2010年
3 刘晓英;知识关联及其应用研究[D];湘潭大学;2010年
4 刘慧;2000-2010年我国IT价值研究的文献计量评析[D];吉林大学;2011年
5 姜朝妮;经济增长模型的包容式演化分析[D];大连理工大学;2011年
6 马秀敏;中国典型管理期刊文献主题发现与演化分析[D];大连理工大学;2011年
7 覃云飞;《Journal of Sports Sciences》研究动态的识别与可视化研究[D];上海体育学院;2011年
8 刘静;新兴学科科学知识图谱构建[D];云南大学;2011年
9 叶然;我国中医护理科研发展状况分析[D];南京中医药大学;2011年
10 闫士涛;知识管理学学科体系构建研究[D];安徽大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈伟雄,马少平,步建华;基于元搜索引擎的多关键词检索技术[J];计算机工程与应用;2004年24期
2 曹步文;刘先锋;汤小康;;数据挖掘技术——聚类算法研究[J];计算机与现代化;2006年11期
3 杨立英;;基因组学领域演进的科学计量研究[J];科学观察;2007年01期
4 唐明珠;张远平;杨佳;;一种基于概念相似度的文本模糊聚类方法[J];科学技术与工程;2007年05期
5 梁立明,谢彩霞;词频分析法用于我国纳米科技研究动向分析[J];科学学研究;2003年02期
6 刘林青;作品共被引分析与科学地图的绘制[J];科学学研究;2005年02期
7 梁立明,李小宁;SPRU科研选题的词频分析与计量研究[J];科研管理;2003年03期
8 李文兰,杨祖国;中国情报学期刊论文关键词词频分析[J];情报科学;2005年01期
9 马大川;马越;;知识地图技术的发展趋势及评价研究[J];情报科学;2006年08期
10 魏瑞斌;;基于关键词的情报学研究主题分析[J];情报科学;2006年09期
中国博士学位论文全文数据库 前1条
1 侯海燕;基于知识图谱的科学计量学进展研究[D];大连理工大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 覃晓;元昌安;;基于遗传算法和自组织特征映射网络的文本聚类方法[J];计算机应用;2008年03期
2 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[J];东南大学学报(英文版);2006年03期
3 严莉莉;张燕平;;基于类信息的文本聚类中特征选择算法[J];计算机工程与应用;2007年12期
4 童健华;谭洪舟;;一种基于人工免疫网络的文本聚类算法[J];计算机工程与科学;2007年10期
5 高茂庭;王正欧;;基于LSA降维的RPCL文本聚类算法[J];计算机工程与应用;2006年23期
6 戴文华;焦翠珍;何婷婷;;基于遗传算法的自适应文本模糊聚类研究[J];计算机科学;2008年08期
7 毛嘉莉;;基于K-means的文本聚类算法[J];计算机系统应用;2009年10期
8 乐兵;王明文;;基于遗传算法的动态文本聚类[J];江西师范大学学报(自然科学版);2006年03期
9 王文军;;基于模糊商空间理论的文本聚类研究[J];科技情报开发与经济;2007年06期
10 孙越恒;李志圣;何丕廉;;基于局部搜索机制的K-Means聚类算法[J];计算机工程;2008年11期
中国重要会议论文全文数据库 前7条
1 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
2 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 章成志;;基于机器学习的文本聚类描述算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 李长吾;李昕;洪文学;康健楠;;模糊传感器语义概念生成方法研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
5 张国英;周俊武;沙芸;;基于约束惩罚的群体智能聚类算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 赵立杰;柴天佑;;事件驱动的多模型MPCA统计监视方法及其应用[A];第二届全国信息获取与处理学术会议论文集[C];2004年
7 彭远光;辜建德;;主成份分析方法在人工智能、专家系统控制策略上的应用[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
中国博士学位论文全文数据库 前9条
1 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
2 陈远浩;非监督的结构学习及其应用[D];中国科学技术大学;2008年
3 何清波;多元统计分析在设备状态监测诊断中的应用研究[D];中国科学技术大学;2007年
4 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
5 牛征;基于多元统计分析的火电厂控制系统故障诊断研究[D];华北电力大学(河北);2006年
6 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
7 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
8 刘平;饮用水砷/氟自动检测系统研究[D];中国科学技术大学;2013年
9 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈小丽;基于SOM算法的中文文本聚类[D];南京理工大学;2008年
2 王冬;基于语义特征的文本聚类的研究与实现[D];吉林大学;2008年
3 郑晓亮;基于改进FCM算法的无字典中文文本聚类方法研究[D];浙江大学;2007年
4 张秀兰;基于遗传算法的模糊聚类技术研究及应用[D];西安科技大学;2009年
5 庄世芳;一种改进的基于概念的中文WEB文本聚类算法的研究[D];福州大学;2006年
6 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
7 常兴龙;机器学习算法在文本分析中的研究[D];天津大学;2008年
8 乐兵;基于遗传算法的文本聚类技术研究[D];江西师范大学;2006年
9 陆鹏;投影寻踪模型在文本聚类算法中的应用研究[D];上海海事大学;2007年
10 赖雅琳;多元统计分析在农机监理系统中的应用[D];郑州大学;2005年
,本文编号:711863
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/711863.html