当前位置:主页 > 科技论文 > 软件论文 >

基于复杂网络的文本关键词提取算法研究

发布时间:2018-05-04 13:42

  本文选题:复杂网络 + 关键词提取 ; 参考:《计算机应用研究》2016年02期


【摘要】:将复杂网络理论应用于文本挖掘技术,构造基于词汇共现性关系的词汇概念复杂网络,对文本词汇的重要性指标进行计算分析,挖掘文本中主题的关键词。在计算词汇重要性指标时,综合考虑目标词汇的频率以及其相邻节点的贡献度。通过实验对比,证实了该网络节点评价指标与基于加权度和加权集聚系数的综合指标相比具有优越性。此外,通过复杂网络社区合并的手段,发现了关键节点之间的网络拓扑关系,即核心网络。通过分析核心网络,可以获得关键词和文本主题的对应关系,为进一步的文本分析提供有效的理论基础。
[Abstract]:This paper applies the theory of complex network to text mining, constructs a complex network of lexical concepts based on lexical co-occurrence relationship, calculates and analyzes the importance index of text vocabulary, and excavates the keywords of topic in the text. When calculating the lexical importance index, the frequency of the target vocabulary and the contribution of its adjacent nodes are taken into account. The experimental results show that the evaluation index of the network node is superior to the comprehensive index based on the weighting degree and the weighted agglomeration coefficient. In addition, the network topology relationship between the key nodes is found by the method of complex network community merging, that is, the core network. By analyzing the core network, the corresponding relationship between keywords and text topics can be obtained, which provides an effective theoretical basis for further text analysis.
【作者单位】: 上海交通大学安泰经济与管理学院;
【分类号】:TP391.1

【参考文献】

相关期刊论文 前1条

1 谢凤宏;张大为;黄丹;谢福鼎;;基于加权复杂网络的文本关键词提取[J];系统科学与数学;2010年11期

【共引文献】

相关期刊论文 前7条

1 郎利影;李思骞;张永强;王勇;;汉语词网络的抗毁性研究[J];科学技术与工程;2015年05期

2 翟周伟;刘刚;吕玉琴;;基于图模型的关键词挖掘方法[J];软件;2012年08期

3 王雅琳;陆向艳;钟诚;;基于链接和萤火虫算法聚类博文发现热点话题[J];计算机工程与设计;2015年06期

4 苏祥坤;吾守尔·斯拉木;买买提依明·哈斯木;;基于词序统计组合的中文文本关键词提取技术[J];计算机工程与设计;2015年06期

5 赵辉;刘怀亮;范云杰;;复杂网络理论在中文文本特征选择中的应用研究[J];现代图书情报技术;2012年09期

6 唐晓波;肖璐;;基于依存句法网络的文本特征提取研究[J];现代图书情报技术;2014年11期

7 杨志墨;刘怀亮;赵辉;;一种基于复杂网络的中文文本表示算法[J];现代图书情报技术;2014年11期

相关硕士学位论文 前6条

1 谢凤宏;基于复杂网络理论的文本聚类和关键词提取方法研究[D];辽宁师范大学;2011年

2 毛新武;基于组合特征的中文新闻网页关键词提取研究[D];北京林业大学;2013年

3 左晓飞;基于复杂网络的关键词提取研究[D];西安电子科技大学;2013年

4 周建;基于DOM结构树和特征词的Web内容提取研究[D];安徽大学;2014年

5 赵辉;基于复杂网络的中文文本分类研究[D];西安电子科技大学;2014年

6 徐云飞;基于分词技术的文本主题关键词处理系统设计与实现[D];中国科学院大学(工程管理与信息技术学院);2014年

【二级参考文献】

相关期刊论文 前5条

1 任克强;赵光甫;张国萍;;基于带权语言网络的网页关键词抽取[J];计算机工程与应用;2008年08期

2 王晓斌;温春;石昭祥;;基于贝叶斯信息准则的文本主题数估计[J];计算机工程;2009年07期

3 王军;词表的自动丰富——从元数据中提取关键词及其定位[J];中文信息学报;2005年06期

4 赵鹏;蔡庆生;王清毅;耿焕同;;一种基于复杂网络特征的中文文档关键词抽取算法[J];模式识别与人工智能;2007年06期

5 张敏;耿焕同;王煦法;;一种利用BC方法的关键词自动提取算法研究[J];小型微型计算机系统;2007年01期

【相似文献】

相关期刊论文 前10条

1 ;规范关键词选择的决定(试行)[J];液晶与显示;2008年01期

2 ;规范关键词选择的决定(试行)[J];液晶与显示;2009年01期

3 ;规范关键词选择的决定(试行)[J];液晶与显示;2009年02期

4 ;规范关键词选择的决定(试行)[J];液晶与显示;2009年03期

5 ;规范关键词选择的决定(试行)[J];液晶与显示;2010年02期

6 ;规范关键词选择的决定(试行)[J];液晶与显示;2010年03期

7 ;规范关键词选择的决定(试行)[J];真空科学与技术学报;2004年01期

8 ;规范关键词选择的决定(试行)[J];液晶与显示;2008年02期

9 ;规范关键词选择的决定(试行)[J];液晶与显示;2008年03期

10 ;规范关键词选择的决定(试行)[J];液晶与显示;2008年04期

相关会议论文 前5条

1 ;规范关键词选择的决定(试行)[A];薄膜技术学术研讨会论文集[C];2003年

2 ;规范关键词选择的决定(试行)[A];中国真空学会2006年学术年会论文集[C];2006年

3 ;规范关键词选择的决定(试行)[A];全国薄膜技术学术研讨会论文集[C];2006年

4 ;规范关键词选择的决定(试行)[A];中国真空学会第六届全国会员大会暨学术会议论文集[C];2004年

5 李春久;;医学论文关键词和CUJA主题词使用对比分析[A];外向型文献库的数据质量控制——首届CUJA系统学术讨论会论文集[C];1990年

相关博士学位论文 前1条

1 丁卓冶;面向主题的关键词抽取方法研究[D];复旦大学;2013年

相关硕士学位论文 前9条

1 刘亚妮;搜索竞价广告关键词优化算法与实验[D];电子科技大学;2011年

2 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年

3 热依莱木·帕尔哈提;文本关键词提取技术及其应用研究[D];新疆大学;2014年

4 王惠勇;多策略关键词抽取及快速文本主题分类研究[D];东北大学;2012年

5 王良芳;文本挖掘关键词提取算法的研究[D];浙江工业大学;2013年

6 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年

7 温安国;基于词语网络的关键词自动提取方法及在中文网页分类中的应用研究[D];复旦大学;2009年

8 彭浩;基于领域关键词自动扩展的变量主题Hopfield聚焦爬虫的研究[D];中南大学;2008年

9 谭志强;面向SEO的网络编辑助手研究与实现[D];西安工程大学;2011年



本文编号:1843181

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1843181.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1296***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com