当前位置:主页 > 理工论文 > 生物学论文 >

大豆代谢领域的论文共同作者网络分析

发布时间:2020-07-22 23:12
【摘要】:近些年来,生物信息学已经逐渐发展成为当今最受关注的交叉学科之一,并衍生出数量众多的研究领域。与此同时,产生了大量的相关科技文献,已有的传统方法已经无法满足对本领域科技文献研究与分析的需要。科研合作网络是一类关于研究人员的社会网络模型,包括研究者以及研究者之间的论文合作关系,可以用来进行大规模的文献分析。本文结合LDA(Latent Dirichlet Allocation)主题模型与科研合作网络,对大豆代谢领域的相关文献进行了分析,并得到了一些有价值的实际结果。主题模型是一种概率生成模型,它的应用十分广泛,涉及到多种方面,在自然语言处理中表现的尤为突出。它的出现能够帮助我们快速的清楚海量的文本数据中隐藏的信息。现今,在机器学习被广泛应用的时代背景下,主题模型获得了学术界的一致认可。与基于本体等知识库的语义方法相比,主题模型挖掘出的语义内容表现的更为丰富,更适合于跨领域的知识发现。复杂网络作为另一个十分重要的研究领域,一直被广泛的应用在各学科领域中的网络问题的研究与分析。其中,社会网络是复杂网络研究中一个较为成熟的研究方向。共同作者网络是根据论文的作者之间的合作关系建立的网络,它是科学合作网络的一种常见形式。如果两个作者共同署名一篇及以上的论文,那么两个作者之间将产生连边关系。共同作者网络可以为学术关系网络结构的研究提供有力的工具。对大豆代谢的研究,有助于我们对作物的生长、产量和品质有更深入的了解。通过对大豆代谢领域科技文献进行深入分析有助于我们把握本领域的发展趋势,通过对大豆代谢领域相关重要人物和机构的追踪,能够抓住本领域的最新动态,把握前沿。本文选择了大豆代谢研究领域的科技文献,首先对数据进行预处理,对摘要文献分别进行LDA主题建模,并进行聚类处理。对聚类的十类结果进行分析,分别对每一类建立词云,通过词云直观的对每一类有一个整体认知。对十类结果进行处理并获取共同作者网络数据后,研究统计了它们的统计属性,并分析了其意义。另外,本文还以时间维度为限定条件,对数据集进行了进一步的分析与讨论。并对网络中的重要节点问题进行了着重分析。通过本文的研究,有助于我们把握大豆代谢领域的研究趋势和最新动态,可以更好地提高对科研合作网络的理解,特别是生物信息学领域形成的网络机制。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:S565.1;Q811.4
【图文】:

建模过程,文本,合作网络


来几年某个领域的动向和前景时,便可以利用这种网络。(3) 共同成员网络当两个个体共同参与了某种组织或者社会活动,那么这些个体便有了联系,从而构成了共同成员网络。比如演员合作网络。(4) 共同作者网络科学合作网络中研究的最多,意义也最大的便是共同作者网络,也是我们本文要研究的合作网络。当两个作者共同完成了一篇及一篇以上的论文,那么两者便产生连边,通过这种规则建立的网络称为共同作者网络。2.4 主题模型相关知识2.4.1 文本挖掘文本挖掘一般经过格式统一,内容提取,词库选择、向量空间创建等步骤来完成。如图 2.2 直观的描述这一系列过程。

示意图,向量空间,示意图,向量空间模型


删除辅助符号等等也都属于归一化范畴。提取(Stemming): 当本挖掘中文的词义分析不会被单词在文影响时,可以把词项简化为词干形式。其中波特词干(PorterS用的英文词干提取方法。构建(Dictionary Construction):作为在文本挖掘中参考的特征所有文档中所有术语的集合,是知识发现的基础。界七十年代,Salton 等人提出向量空间模型(VSM:Vecto量空间示意图如图 2.3 所示。向量空间模型概念简单,它是将数字化处理,简化为文本空间中的数字向量运算。把文档映射之后,我们便可以通过计算文本空间中向量之间的相似性作为判断的依据。在文本处理中,余弦距离是最常用的相似性度向量空间模型所具有的独特属性导致它在被科研工作者们大量析中。

主题,模型框架,向量


第 3 章 方法介绍价标准的介绍。主题模型型下,“文本-主题”向量m 和“主题-词语”向量k 分别通过超参 的狄利克雷分布得到。根据上述描述,我们可以得到整个流

【相似文献】

相关期刊论文 前10条

1 安娟;刘芳;魏晓星;李耀东;顾存林;;主题式生物信息学教学理论和实践初索[J];教育教学论坛;2018年22期

2 蔡富娟;汪煜琦;;新技术背景下对生物信息学教育的重新审视[J];课程教育研究;2017年09期

3 苏孝保,张宗兵;说说生物信息学[J];生物学教学;2004年10期

4 ;生物信息学2016年第14卷总目次[J];生物信息学;2016年04期

5 张东升;;生物信息学的本科教学实践[J];时代教育;2018年01期

6 吴建盛;袁京洲;周家特;高昊;;《生物信息学》试卷库建设的研究与实践[J];考试周刊;2018年85期

7 齐云峰;孙添添;于长春;郝树琳;金太成;;浅谈如何提高生物信息学教学质量[J];散文百家(新语文活页);2016年12期

8 付陈增;蔡丽娜;;结核分枝杆菌蛋白Rv0694的生物信息学分析[J];科学中国人;2017年03期

9 孙庆;齐云峰;易国栋;;大学生物信息学教材浅析[J];散文百家(新语文活页);2017年01期

10 M.泽瓦勒贝;JO.鲍姆;;理解生物信息学[J];新疆农业科学;2012年02期

相关会议论文 前10条

1 张学工;;生物信息学[A];2007-2008控制科学与工程学科发展报告[C];2008年

2 杨剑;;生物信息学在新发再发传染病研究中的应用[A];新发和再发传染病防治热点研讨会论文集[C];2011年

3 高亚梅;韩毅强;余丽芸;;生物信息学本科教学研究初探[A];高教科研2006(中册:教学改革)[C];2006年

4 张学工;;生物信息学[A];2010-2011控制科学与工程学科发展报告[C];2011年

5 潘洁;;生物信息学对中药现代化的作用[A];2006第六届中国药学会学术年会论文集[C];2006年

6 刘湘军;;生物信息学的研究现状[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

7 唐一源;沈钧贤;徐志敏;;生物信息学与神经信息学数据库的整合[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

8 李俊;;生物信息学方法预测调控变异[A];中国生物工程学会第二届青年科技论坛暨首届青年工作委员会学术年会论文集[C];2017年

9 康晓东;;生物信息学及其研究对象[A];2003年全国医学影像技术学术会议论文汇编[C];2003年

10 吴栋杨;孙啸;;构建基于R语言的生物信息学研究平台[A];第十次中国生物物理学术大会论文摘要集[C];2006年

相关重要报纸文章 前10条

1 本报记者 赵广立;大数据爆发让生物信息学“C位出道”[N];中国科学报;2018年

2 张思玮;生物信息学解码大数据 “生命之矿”[N];中国科学报;2019年

3 中科院大学博士生 魏伟佳;年轻而大有可为的生物信息学[N];中国青年报;2016年

4 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年

5 李斌;我国科学家“解读”生命奥秘[N];科技日报;2001年

6 记者 王雪飞;我国科学家向政府建议——加强生物信息学学科建设[N];健康报;2000年

7 王宏;高性能计算应用于生物信息学领域[N];中国计算机报;2003年

8 张雅丽;加强交流 立足中国生物信息学最新进展[N];科技日报;2000年

9 本报记者 白毅;生物信息学院士谈[N];中国医药报;2002年

10 王雪飞 吴黎;中国生物信息学研究快速发展[N];健康报;2002年

相关博士学位论文 前10条

1 李胜;AEBP1参与调控儿童急性淋巴细胞白血病机制的研究[D];南京医科大学;2019年

2 胡瀚洋;差异转录组的生物信息学研究体系在小鼠和人类转录组研究中的应用[D];武汉大学;2014年

3 乔立安;基于网格的生物信息学计算流程系统的研究[D];清华大学;2005年

4 张成岗;基于本地和WEB的生物信息学综合分析体系的建立及部分新基因的初步实验研究[D];中国人民解放军军事医学科学院;2000年

5 王娴;蛋白残基可溶性预测及基因表达数据分析方法研究[D];中国科学技术大学;2007年

6 高胜寒;基于Web2.0技术的进化综合分析工具EvoME的研究与实现[D];中国科学院北京基因组研究所;2014年

7 于晓庆;基于支持向量机的生物数据分析方法研究[D];上海师范大学;2012年

8 刘太岗;机器学习方法在生物信息学中的应用[D];大连理工大学;2010年

9 杨帅;面向组学大数据的生物信息学研究[D];中国人民解放军军事医学科学院;2016年

10 周涛;人与猕猴精子发生相关蛋白质组的生物信息学研究[D];南京医科大学;2014年

相关硕士学位论文 前10条

1 陈阳;基于生物信息学筛选头颈部鳞状细胞癌潜在生物标志物[D];吉林大学;2019年

2 陈思;大豆代谢领域的论文共同作者网络分析[D];吉林大学;2019年

3 黄志弘;UNC5D的系统生物信息学分析及其在肾癌生物学行为预测中的应用[D];中国医科大学;2018年

4 王玺婷;利用生物信息学技术对肿瘤微环境中差异表达基因及ALK激酶耐药和OPN表位确定初步研究[D];江苏大学;2018年

5 刘维;生物信息学中的并行处理[D];扬州大学;2007年

6 汤思捷;蛋白质可溶性预测的生物信息学模型及应用[D];苏州大学;2014年

7 韩欣;基于本体论的生物信息学领域资源语义检索研究[D];中北大学;2012年

8 王素华;基于遗传模拟退火算法的生物信息学双序列比对方法研究[D];东北师范大学;2006年

9 唐南南;生物序列的图形表示及系统发生分析[D];大连理工大学;2006年

10 任艳姣;生物信息学数据整合的应用研究[D];吉林大学;2012年



本文编号:2766499

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2766499.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a1efc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com