当前位置:主页 > 科技论文 > 基因论文 >

基于信息抽取的疾病与基因关联关系研究

发布时间:2021-12-18 05:54
  目的:从医学信息学的视角出发,旨在从生物医学文献数据中发现疾病与基因的关联关系。为从文献中发现疾病与基因的关联关系,建立基于信息抽取的疾病-基因关联关系发现模式。研究对关联关系的强度与深度进行定义与分析,从文献中发现疾病与基因的关联关系,实现基于文献数据的知识发现。应用PubMed中糖尿病并发症主题的文献数据进行实证研究,发现糖尿病并发症与基因的关联关系,论证揭示模式的科学性、在知识发现领域的合理性和可行性。通过对文献摘要数据进行文本挖掘,发现疾病关联基因及其规律,实现知识发现,为疾病的预防与治疗提供依据。方法:通过文献调研法系统详实地对医学文本挖掘、信息抽取等领域的国内外研究现状进行综述,并对研究相关的理论与方法进行述评。基于当前研究现状与理论方法基础,提出基于信息抽取的疾病-基因关联关系发现模式。关联关系发现模式可发现疾病与基因间的关联关系,并从关系的关联强度与关联深度进行关系的剖析与揭示。模式整合了本体理论和共词分析法、命名实体识别、关系抽取等技术的思想,从文献摘要中识别并抽取疾病与基因的关联关系。应用知识发现和文献计量学理论,定义并分析了疾病与基因关联关系的强度与深度:关联关系...

【文章来源】: 吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:67 页

【文章目录】:
中文摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究目的与意义
        1.2.1 研究目的
        1.2.2 研究意义
    1.3 国内外研究现状
        1.3.1 生物医学领域文本挖掘研究现状
        1.3.2 信息抽取研究现状
        1.3.3 国内外研究现状述评
    1.4 研究内容与论文结构
        1.4.1 研究内容
        1.4.2 论文结构
    1.5 研究方法与研究思路
        1.5.1 研究方法
        1.5.2 研究思路
第2章 相关理论与方法
    2.1 相关理论基础
        2.1.1 知识发现理论
        2.1.2 本体理论
        2.1.3 文献计量学
    2.2 相关方法
        2.2.1 共词分析法
        2.2.2 信息抽取
        2.2.3 聚类分析
        2.2.4 基因富集
第3章 疾病-基因关联关系发现模式研究
    3.1 模式构建
        3.1.1 模式概念
        3.1.2 模式流程
    3.2 关联强度发现
        3.2.1 疾病与基因的实体识别
        3.2.2 疾病与基因的关系抽取
        3.2.3 关联强度分析
    3.3 关联深度发现
        3.3.1 语义关联揭示
        3.3.2 生物关联揭示
    3.4 本章小结
第4章 疾病-基因关联关系发现模式实证研究
    4.1 数据获取
        4.1.1 疾病选取
        4.1.2 数据来源
        4.1.3 检索策略
        4.1.4 数据导出
    4.2 词表构建
    4.3 疾病-基因关联强度分析
        4.3.1 疾病-基因关联关系发现
        4.3.2 关联强度分析结果
        4.3.3 关联强度发现
    4.4 疾病-基因关联深度分析
        4.4.1 不同并发症共同关联基因分析
        4.4.2 疾病-基因语义关系发现
        4.4.3 关联深度发现
    4.5 本章小结
第5章 结论与展望
    5.1 研究结论
    5.2 研究创新点
    5.3 研究局限与展望
        5.3.1 研究局限
        5.3.2 研究展望
参考文献
作者简介及科研成果
致谢


【参考文献】:
期刊论文
[1]胃癌相关易感基因的生物信息学分析 [J]. 李玲,苏韫,刘永琦,骆亚莉,张丽英,王凤梅,任春贞,卢志伟,柳峰峰.  中华中医药杂志. 2018(06)
[2]基于生物医学文献挖掘的疾病-基因-药物关系抽取研究 [J]. 翟菊叶,叶泽坤,杨枢,刘长青.  新余学院学报. 2018(02)
[3]基于数据立方体挖掘疾病–基因–药物新关联 [J]. 魏星,胡德华,易敏寒,朱启贞,朱文婕.  数据分析与知识发现. 2017(10)
[4]全基因组关联研究通路分析方法现状 [J]. 王钰嫣,王子兴,胡耀达,王蕾,李宁,张彪,韩伟,姜晶梅.  遗传. 2017(08)
[5]共词分析过程中的若干问题研究 [J]. 李纲,巴志超.  中国图书馆学报. 2017(04)
[6]利用GEO数据库分析结肠癌中EZH2及其相关基因的表达与意义 [J]. 宋达为,黄睿,汤庆超,马天翼,罗玥琛,王贵玉,王锡山.  中华结直肠疾病电子杂志. 2016(06)
[7]基于多维度聚合的网络资源知识发现框架研究 [J]. 夏立新,陈晨,王忠义.  情报科学. 2016(05)
[8]糖尿病患者需注意心血管并发症 [J]. 韩旭.  开卷有益—求医问药. 2016(04)
[9]大数据知识发现的本体论追问 [J]. 段伟文.  哲学研究. 2015(11)
[10]糖尿病肾病的发病机制及治疗进展 [J]. 余翠,熊钱颖,王李卓,高家林.  医学综述. 2015(21)

博士论文
[1]Irisin及其基因多态性与中国人2型糖尿病相关临床性状及微血管并发症的关系[D]. 唐珊珊.上海交通大学. 2015
[2]2型糖尿病大血管并发症中血管平滑肌细胞增殖相关基因DNA甲基化的作用研究[D]. 徐哲奕.华中科技大学. 2014
[3]面向生物医学文本的疾病关系挖掘模型及算法研究[D]. 杨黎.华中科技大学. 2013

硕士论文
[1]基于UMLS和通路数据的潜在语义分析技术的研究与实现[D]. 尚美辰.黑龙江大学. 2015
[2]基于多核学习的肿瘤—药物—基因语义关系提取[D]. 王逯姚.北京协和医学院. 2015
[3]面向语义关系发现的文本挖掘研究[D]. 刘明岩.南京理工大学. 2010



本文编号:3541768

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3541768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a3f74***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com