当前位置:主页 > 论文百科 > 期刊论文 >

面向期刊论文的知识挖掘研究

发布时间:2018-05-07 03:27

  本文选题:科学计量学 + 可视化 ; 参考:《河北大学》2014年硕士论文


【摘要】:随着科技的发展,人们在各领域的研究越发深入,科技文献的数量也随之增多,在为我们提供了更多新方法和新知识的同时也带来了新的问题:海量的文献资源与人们的阅读时间和利用能力形成了矛盾,阻碍了人们对科技文献的利用。本文面向期刊论文进行知识挖掘研究:其一有助于科技管理人员把握期刊整体结构及发展现状,从而帮助相关人员针对期刊建设做出合理的决策;其二从大量的科技文献中发现主流主题及其演化情况,可以帮助科研人员减少查阅科技文献的时间,便于对科技文献进行整理和总结,把握学科前沿方向,对科研人员的研究具有一定的指导意义。 本文通过对2000-2011年间某期刊论文进行统计和分析,呈现了该期刊在研究队伍、地域分布、基金资助及其主题内容等情况,以揭示该期刊研究的趋势和特征。本文的主要工作和贡献如下: 1.研究分析了科学计量学、主题模型的基本理论和方法,并应用科学计量学方法和主题模型对期刊论文进行了知识挖掘。 2.应用科学计量学方法对期刊论文的作者、机构、基金资助等内容进行了挖掘,实验结果可以帮助相关人员针对期刊建设做出合理的决策,为期刊的评价提供了量化依据。 3.把主题模型方法引入期刊论文挖掘,挖掘出了主题分布、主题变化等知识。本文给出“主题共现”方法来描述主题情况,相对于传统的关键字共现的方式,具有描述清晰简洁、语义明确的特点。实验表明,主题模型方法应用于中文期刊论文知识挖掘,具有较好的效果。可以帮助科研人员减少查阅时间,便于对科技文献进行整理和总结,正确把握学科前沿方向。
[Abstract]:With the development of science and technology, people's research in various fields has become more and more in-depth, and the number of scientific and technological documents has also increased. It not only provides us with more new methods and new knowledge, but also brings new problems: the huge amount of literature resources and people's reading time and ability to use the contradiction, hindered the use of scientific and technological documents. This paper aims at the research of knowledge mining for journal papers: firstly, it helps the scientific and technological managers to grasp the whole structure and the current development of periodicals, thus helping the relevant personnel to make reasonable decisions on the construction of periodicals; Second, finding the mainstream themes and their evolution from a large number of scientific and technological documents can help researchers to reduce the time for consulting scientific and technological documents, facilitate the sorting and summing up of scientific and technological documents, and grasp the frontier direction of science and technology. It has certain guiding significance to the research of scientific research personnel. Based on the statistics and analysis of a periodical paper from 2000 to 2011, this paper presents the research team, regional distribution, fund support and its subject content in order to reveal the trend and characteristics of the periodical research. The main work and contributions of this paper are as follows: 1. This paper studies and analyzes the basic theories and methods of science metrology and subject model, and applies the scientific metrology method and subject model to mine the knowledge of journal papers. 2. The scientific metrology method is applied to excavate the contents of the journal papers such as authors, institutions, funds, etc. The experimental results can help the relevant personnel to make reasonable decisions on the periodical construction and provide the quantitative basis for the evaluation of the periodicals. 3. The method of topic model is introduced into the mining of journal papers, and the knowledge of topic distribution and theme change is excavated. This paper presents a method of "theme co-occurrence" to describe the topic situation. Compared with the traditional keyword co-occurrence method, it has the characteristics of clear description and clear semantics. The experimental results show that the method of topic model is effective in the knowledge mining of Chinese periodicals. It can help the scientific research personnel to reduce the time of consulting, facilitate the collation and summary of the scientific and technological documents, and correctly grasp the frontier direction of the subject.
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1

【共引文献】

相关期刊论文 前10条

1 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期

2 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期

3 杨尔弘;;媒体5年词语使用情况调查分析[J];北华大学学报(社会科学版);2011年04期

4 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期

5 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期

6 张晨;祁坤钰;;基于Penn Treebank英语标注集对《圣经》标注集的扩充研究[J];才智;2009年20期

7 祁峰;;单音节形容词和名词组合的选择性机制[J];长春师范学院学报(人文社会科学版);2009年03期

8 傅鹂;孙坚;付春雷;;基于语义的音乐检索系统[J];重庆理工大学学报(自然科学版);2011年01期

9 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期

10 王小海;关于计算词典学[J];辞书研究;2003年05期

相关会议论文 前10条

1 李金;宋阳;梁洪;;语言残障患者医疗辅助系统设计[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年

2 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

4 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

5 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

6 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

7 张俊萍;冯志伟;;CTT在汉语语法研究和教学中的应用[A];第六届汉语词汇语义学研讨会论文集[C];2005年

8 冯志伟;;确定切词单位的某些非语法因素[A];语言文字应用研究论文集(Ⅱ)[C];2004年

9 李晋霞;;面向计算机的“V_双+N_双”结构类型研究[A];语言文字应用研究论文集(Ⅱ)[C];2004年

10 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年

相关硕士学位论文 前10条

1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年

2 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年

3 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年

4 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年

5 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年

6 孙静;基于组合分类器的生物命名实体识别[D];大连理工大学;2010年

7 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年

8 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年

9 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年

10 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年



本文编号:1855213

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/xingzhengshiwu/1855213.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0a0a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com