文本数据的生物信息学模型及在前列腺癌中的应用研究
发布时间:2021-09-03 22:23
大量的生物文本为生物医学研究提供了丰富的资源。但由于文本数量巨大,无法通过人工处理来获取信息。文本挖掘能从现有的文献中自动地挖掘感兴趣的信息。借助于文本挖掘,可以从文献数据库检索需要的生物医学文本;这些非结构化的文本包含了大量的研究成果和实验数据,文本挖掘可以找出其中蕴含的重要信息和知识;在所发现的信息的基础上,研究人员可以进一步生成假设、进行推断和预测、指导实验和更深入的研究。癌症已经成为影响人类健康的主要恶性疾病之一,对癌症的预防、诊断和治疗是一个重要的研究热点。以文本形式存在的大量癌症相关的文献和实验数据为生物医学研究提供了宝贵的资料。许多研究者借助于文本挖掘在处理文本数据方面的优势,将癌症研究和文本挖掘相结合,使用文本挖掘技术发现新的知识,以促进生物医学的深入研究。本文综述了文本挖掘的各项子任务、一般处理流程、常用数据集和工具,介绍了目前文本挖掘在癌症中的应用研究,具体包括:1)介绍了文本挖掘的相关概念、各项子任务以及处理流程;2)细述了一些常用的文本挖掘工具和语料,分析比较了这些工具的优缺点和适用领域;3)分析总结了基于文本挖掘的癌症系统生物学研究常规流程;4)指出了文本挖掘...
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:127 页
【学位级别】:博士
【部分图文】:
以“textmining”为检索词在PubMed中搜索文献数量及趋势
是现今生物医学研究者关注的一个问题。第三,通过文本挖掘预测结生成假设以指导实验以及进一步的深入研究,是非常有帮助的。这既是一个研究,也是一个需要解决的挑战。2.2 文本挖掘及其子任务文本挖掘的过程主要包括信息检索(Information Retrieval)、信息抽取(Informatixtraction)、知识发现(Knowledge Discovery)和假设生成(Hypothesis Generation息检索是检索与感兴趣的信息相关的文本,包括题目、摘要、段落和句子等。信取主要的目的是从数据集中挖掘出一些预定义的特殊信息,包括实体的类型和实的关系等。知识发现从文本数据中抽取新的知识。假设生成是在文本的基础上,出未知的知识。文本挖掘的四个阶段如图 2-2 所示,首先从文本集中检索出所需本,通过实体识别找出文本实体,通过信息抽取发现显性的知识,也可以通过假成产生假设,指导实验和研究。相应地,生物文本挖掘包括了信息检索、命名体、关系抽取盒假设生成等子任务。
生物信息学模型及在前列腺癌中的应用研究 第 2 章 文本挖掘在癌症中的员重要的研究领域之一。在文献数据库中,存在的大量的关于癌症的生物 以 “ cancer ” 作 为 检 索 词 ( text mining[Title/Abstract] or literTitle/Abstract])在 PubMed[24]中搜索文献,总共检索得到 637125 篇关于,并且呈逐年增加的趋势,如图 2-3 所示。这些大量关于癌症的研究文献值的资源。
【参考文献】:
期刊论文
[1]上海市徐汇区2000—2010年恶性肿瘤发病率统计分析[J]. 张琴,顾治华,倪红伟. 山西医药杂志. 2012(06)
[2]蛋白质相互作用网络的蜂群信息流聚类模型与算法[J]. 雷秀娟,田建芳. 计算机学报. 2012(01)
[3]雄激素非依赖前列腺癌细胞系代谢组学的初步研究[J]. 刘永霞,朱小丽,陈玉华,郭飞,沈默,陈占国,徐威,陈德莹,陶志华. 分析化学. 2011(03)
[4]一种基于Q学习的LDoS攻击实时防御机制及其CPN实现[J]. 刘陶,何炎祥,熊琦. 计算机研究与发展. 2011(03)
[5]最小状态变元平均奖赏的强化学习方法[J]. 刘全,傅启明,龚声蓉,伏玉琛,崔志明. 通信学报. 2011(01)
[6]survivin和GRIM-19在前列腺癌组织中的表达[J]. 刘艳波,沈维高,葛贺,盖晓东,芦丽莉,赵雪俭. 中华男科学杂志. 2011(01)
[7]基于Q学习的无线传感器网络自组织方法研究[J]. 章韵,王静玉,陈志,鲍贵城,周峰,扈罗全. 传感技术学报. 2010(11)
[8]强化学习研究综述[J]. 陈学松,杨宜民. 计算机应用研究. 2010(08)
[9]Fuzzy Q-learning in continuous state and action space[J]. XU Ming-liang1,2,XU Wen-bo2 1. Department of Electronic Information Engineering,Wuxi City College of Vocational Technology,Wuxi 214063,China 2. School of Information Technology,Jiangnan University,Wuxi 214122,China. The Journal of China Universities of Posts and Telecommunications. 2010(04)
[10]前列腺癌的表观遗传学研究进展[J]. 易晓明,周文泉. 中华男科学杂志. 2010(07)
本文编号:3381974
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:127 页
【学位级别】:博士
【部分图文】:
以“textmining”为检索词在PubMed中搜索文献数量及趋势
是现今生物医学研究者关注的一个问题。第三,通过文本挖掘预测结生成假设以指导实验以及进一步的深入研究,是非常有帮助的。这既是一个研究,也是一个需要解决的挑战。2.2 文本挖掘及其子任务文本挖掘的过程主要包括信息检索(Information Retrieval)、信息抽取(Informatixtraction)、知识发现(Knowledge Discovery)和假设生成(Hypothesis Generation息检索是检索与感兴趣的信息相关的文本,包括题目、摘要、段落和句子等。信取主要的目的是从数据集中挖掘出一些预定义的特殊信息,包括实体的类型和实的关系等。知识发现从文本数据中抽取新的知识。假设生成是在文本的基础上,出未知的知识。文本挖掘的四个阶段如图 2-2 所示,首先从文本集中检索出所需本,通过实体识别找出文本实体,通过信息抽取发现显性的知识,也可以通过假成产生假设,指导实验和研究。相应地,生物文本挖掘包括了信息检索、命名体、关系抽取盒假设生成等子任务。
生物信息学模型及在前列腺癌中的应用研究 第 2 章 文本挖掘在癌症中的员重要的研究领域之一。在文献数据库中,存在的大量的关于癌症的生物 以 “ cancer ” 作 为 检 索 词 ( text mining[Title/Abstract] or literTitle/Abstract])在 PubMed[24]中搜索文献,总共检索得到 637125 篇关于,并且呈逐年增加的趋势,如图 2-3 所示。这些大量关于癌症的研究文献值的资源。
【参考文献】:
期刊论文
[1]上海市徐汇区2000—2010年恶性肿瘤发病率统计分析[J]. 张琴,顾治华,倪红伟. 山西医药杂志. 2012(06)
[2]蛋白质相互作用网络的蜂群信息流聚类模型与算法[J]. 雷秀娟,田建芳. 计算机学报. 2012(01)
[3]雄激素非依赖前列腺癌细胞系代谢组学的初步研究[J]. 刘永霞,朱小丽,陈玉华,郭飞,沈默,陈占国,徐威,陈德莹,陶志华. 分析化学. 2011(03)
[4]一种基于Q学习的LDoS攻击实时防御机制及其CPN实现[J]. 刘陶,何炎祥,熊琦. 计算机研究与发展. 2011(03)
[5]最小状态变元平均奖赏的强化学习方法[J]. 刘全,傅启明,龚声蓉,伏玉琛,崔志明. 通信学报. 2011(01)
[6]survivin和GRIM-19在前列腺癌组织中的表达[J]. 刘艳波,沈维高,葛贺,盖晓东,芦丽莉,赵雪俭. 中华男科学杂志. 2011(01)
[7]基于Q学习的无线传感器网络自组织方法研究[J]. 章韵,王静玉,陈志,鲍贵城,周峰,扈罗全. 传感技术学报. 2010(11)
[8]强化学习研究综述[J]. 陈学松,杨宜民. 计算机应用研究. 2010(08)
[9]Fuzzy Q-learning in continuous state and action space[J]. XU Ming-liang1,2,XU Wen-bo2 1. Department of Electronic Information Engineering,Wuxi City College of Vocational Technology,Wuxi 214063,China 2. School of Information Technology,Jiangnan University,Wuxi 214122,China. The Journal of China Universities of Posts and Telecommunications. 2010(04)
[10]前列腺癌的表观遗传学研究进展[J]. 易晓明,周文泉. 中华男科学杂志. 2010(07)
本文编号:3381974
本文链接:https://www.wllwen.com/yixuelunwen/mjlw/3381974.html
最近更新
教材专著