当前位置:主页 > 论文百科 > 资源利用论文 >

基于论文摘要及引用信息的领域研究热点发现

发布时间:2017-12-24 11:29

  本文关键词:基于论文摘要及引用信息的领域研究热点发现 出处:《哈尔滨工业大学》2012年硕士论文 论文类型:学位论文


  更多相关文章: 论文摘要 引用信息 聚类 热点发现


【摘要】:在信息呈现爆炸式快速增长的互联网信息时代,要想从这些海量的信息中,去除冗余信息,挑选出自己真正需要的,并不是一件非常容易的事情。同样,对于从事科学活动的研究者来说,情况也是类似的。研究者经常需要了解自己所研究领域的研究热点的发展变化趋势;并且,有时甚至需要研究者能够快速地了解并进入一个新的研究领域。阅读相关领域的海量的论文,并从中获取该领域的研究热点显然是一个相当痛苦的过程。如果通过领域内的论文集,能自动发现领域的研究热点,肯定对需要了解相关信息的研究者有很大的帮助作用。基于此目的,本文研究了基于论文摘要及引用信息的领域研究热点发现的相关问题。本文的主要工作如下: 第一、利用论文间的引用关系及作者、发表时间等论文本身的基本信息,本文抽取了被其他ACL论文引用次数不少于20次的,876篇ACL论文的摘要文本及引用信息文本,构建了论文摘要语料库及论文引用信息语料库。 第二、本文提出了一种基于论文摘要及引用信息的领域研究热点发现策略,对语料库中的文本执行了热点发现过程中的一系列关键操作,首先过滤掉其中的对发现热点无贡献的噪声停用词,用一种改进的TF方法选取那些能充分代表该文本内容的特征词;将这些特征词向量化并赋予权值,以数学的语言对该文本进行重新描述;之后对文本执行一种融合了AP算法与K均值算法的聚类操作,每个类簇都是对该论文的部分研究内容的一个概括。 第三、从聚类的结果的每一个类簇中,提取最能代表该类簇的句子,将这些句子整合生成对该论文的一个更全面的总结,从该总结中发现该论文的研究话题焦点;将发现的论文集中的论文的研究话题焦点汇总,并利用论文的发表时间信息,发现该领域的研究热点;结果显示这种策略发现的领域研究热点基本体现了该特定领域的本质特点,证明这种策略是有效的。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期

2 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期

3 武佳薇;李雄飞;孙涛;李巍;;邻域平衡密度聚类算法[J];计算机研究与发展;2010年06期

4 梁吉业;白亮;曹付元;;基于新的距离度量的K-Modes聚类算法[J];计算机研究与发展;2010年10期

5 邢永康;马少平;;信息检索的概率模型[J];计算机科学;2003年08期

6 杨凯峰;张毅坤;李燕;;基于文档频率的特征选择方法[J];计算机工程;2010年17期

7 张成栋;;EAME(易觅)英文摘要写作的利器[J];辽宁工学院学报(社会科学版);2007年05期

8 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期

9 张东礼,汪东升,郑纬民;基于VSM的中文文本分类系统的设计与实现[J];清华大学学报(自然科学版);2003年09期

10 肖宇;于剑;;基于近邻传播算法的半监督聚类[J];软件学报;2008年11期



本文编号:1328211

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/qiuzhijiqiao/1328211.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户19e71***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com