当前位置:主页 > 社科论文 > 图书档案论文 >

基于多源UGC数据的健康领域知识图谱构建

发布时间:2017-05-04 02:11

  本文关键词:基于多源UGC数据的健康领域知识图谱构建,由笔耕文化传播整理发布。


【摘要】:消费者的医疗保健观念从过去的被动就医,甚至讳疾忌医,到如今Web2.0时代的积极管理,主动分享。消费者的就医模式也从原来的医院挂号临床就医,向着关注预防和日常保健、康复方向转变。也因此,学术界、医学界、商界都在积极探索如何才能为普通消费者提供更加精准、便捷和全面地医疗保健服务。而确认消费者对健康信息关注的主题是把握消费者健康信息需求,进而提供精准医疗保健服务的先决条件。然而,就目前的研究来看,对消费者健康主题分析的研究通常聚焦于某一类具体的疾病,所用到的数据样本多直接来自于消费者的,且用到的研究方法也大多是问卷调查法、实验法、访谈法等定性的研究方法。这些都有可能导致样本量过小,研究范围过窄,导致结论不够全面,适用性不够强。因此,本文提出结合使用定性和定量方法,对来自于为大众普遍使用的社交媒体上的多种疾病数据进行采集分析,提炼健康主题,提取特征词汇及特征词间关系,最终构建消费者健康知识图谱,深入分析和讨论了知识图谱对于消费者健康信息素养提升和健康信息系统设计的启示,并探索了知识图谱的具体应用场景。本文的创新工作主要体现在以下几点:(1)研究对象的创新。本文综合了四类社交媒体平台上三种不同疾病的UGC数据作为研究对象,尝试最大程度地覆盖不同文本类型的不同疾病的健康信息文本,在此基础上构建消费者关注的健康主题体系,并绘制图谱和得出相关结论。(2)研究方法的应用创新。本文提出了将定性研究方法开放式编码与定量研究方法文本挖掘相结合,完成主题提炼和代表主题的特征词提炼,以及特征词间关系提炼,有效地从大量且结构不一的文本数据中提取了多层次的主题特征,利于可视化展示和解读。并在知识图谱实现时引入图形知识库作为解决途径。(3)研究成果的创新。本文通过研究分析,发现,如果假设消费对各类疾病的关注度一致,消费者对于各类疾病的不同主题关注度存在明显差异;不同健康主题之间也有远近亲疏之分;来自不同社会化媒体的用词用语在描述同一种疾病时也存在差异等有趣结论。
【关键词】:知识图谱 健康 UGC 社交媒体 编码
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G353.1
【目录】:
  • 内容摘要6-7
  • Abstract7-10
  • 1 绪论10-19
  • 1.1 研究背景与意义10-13
  • 1.2 国内外相关研究13-15
  • 1.2.1 健康主题的研究角度13-15
  • 1.2.2 健康主题的研究方法15
  • 1.3 研究目的和研究内容15-17
  • 1.4 研究方法17-18
  • 1.5 本文的组织结构18-19
  • 2 文献综述19-25
  • 2.1 消费者健康信息学19-21
  • 2.2 知识图谱方法及其应用21-25
  • 2.2.1 知识图谱的主要应用类型21-23
  • 2.2.2 知识图谱的构建流程23
  • 2.2.3 知识图谱绘制工具23-25
  • 3 健康领域知识图谱构建框架25-39
  • 3.1 总体思路25-26
  • 3.2 数据采集策略26-30
  • 3.2.1 社会化媒体选择26-28
  • 3.2.2 疾病选择28-29
  • 3.2.3 数据采集方案29-30
  • 3.3 开放式编码30-32
  • 3.3.1 引入开放式编码技术的可行性与意义30-31
  • 3.3.2 编码策略的选择31-32
  • 3.4 特征词提取32-35
  • 3.4.1 分词和文本预处理32-33
  • 3.4.2 特征词抽取33-35
  • 3.5 特征词关系提取35-37
  • 3.5.1 选择词共现提取特征词关系的原因35-36
  • 3.5.2 特征词关系提取的方案36-37
  • 3.6 知识图谱绘制37-39
  • 3.6.1 选择Neo4j绘制图谱的原因37-38
  • 3.6.2 Neo4j的基本使用38-39
  • 4 健康领域基于UGC数据的知识图谱绘制39-57
  • 4.1 数据来源39-42
  • 4.1.1 数据采集实现39-41
  • 4.1.2 数据概述41-42
  • 4.2 三种疾病UGC数据开放式编码42-48
  • 4.3 三种疾病UGC数据特征词提取48-52
  • 4.4 三种疾病UGC数据特征词关系提取52-54
  • 4.5 基于UGC数据的健康知识图谱绘制54-57
  • 4.5.1 数据导入54-55
  • 4.5.2 图谱绘制及分析55-57
  • 5 分析与启示57-69
  • 5.1 不同疾病主题热度差异探讨57-60
  • 5.1.1 分析57-59
  • 5.1.2 启示59-60
  • 5.2 健康主题之间关系探讨60-64
  • 5.2.1 分析60-63
  • 5.2.2 启示63-64
  • 5.3 特征词特点探讨64-67
  • 5.3.1 分析64-66
  • 5.3.2 启示66-67
  • 5.4 特征词之间关系探讨67-69
  • 5.4.1 分析67-68
  • 5.4.2 启示68-69
  • 6 健康知识图谱的应用69-72
  • 6.1 为完善健康信息系统设计提供解决思路69-70
  • 6.2 为提升公共图书馆健康信息服务提供借鉴70-71
  • 6.3 为消费者健康信息相关研究提供理论基础71-72
  • 7 总结和展望72-74
  • 7.1 总结72-73
  • 7.2 不足与展望73-74
  • 参考文献74-80
  • 后记80

【相似文献】

中国期刊全文数据库 前1条

1 李英英;王惠临;;主题图技术在消费者健康信息资源组织中的应用——以糖尿病为例[J];现代图书情报技术;2013年12期

中国重要会议论文全文数据库 前4条

1 ;健康优质的食用油专家——上海佳格食品有限公司[A];“全国老年营养学术研讨会”暨“四川省营养学会成立二十周年庆祝会”会议录[C];2008年

2 苏敬轼;;发展多种产品,满足消费者健康、营养的需求[A];21世纪人类食品面临的新问题学术论文集[C];2001年

3 匡宝晓;;提高猪肉品质,保护消费者健康[A];中国猪业发展大会暨中国畜牧业协会猪业分会第二届会员代表大会论文集[C];2007年

4 尤如华;;标准化无公害养猪生产技术探讨[A];云南省首届无公害猪肉生产研讨会、云南省奶业发展对策研讨会论文集[C];2004年

中国重要报纸全文数据库 前10条

1 市林业局局长 赵秀志;加强果品无公害生产监管 切实保障消费者健康安全[N];新乡日报;2006年

2 本报记者 张恒;五大问题危害消费者健康[N];中国消费者报;2005年

3 吕妍 陈炳山;消费者健康和安全不容漠视[N];新华日报;2006年

4 ;以德结缘 拥抱健康[N];河北日报;2010年

5 洪其华;消费者健康才是关键[N];第一财经日报;2006年

6 记者  马文生;政企携手维护消费者健康安全[N];中国国门时报;2006年

7 中国消费者报 刘焱;“消费者健康洗涤承诺企业”品牌工程在全国展开[N];中国消费者报;2006年

8 ;食品生产经营活动中存在的问题[N];中国食品质量报;2003年

9 纪帆;健康与否决定人们是否买3D电视[N];中国信息报;2010年

10 ;提高猪肉品质 保护消费者健康[N];中国畜牧兽医报;2007年

中国硕士学位论文全文数据库 前2条

1 金碧漪;基于多源UGC数据的健康领域知识图谱构建[D];华东师范大学;2016年

2 徐一方;消费者健康信息需求模型的构建与应用[D];华东师范大学;2015年


  本文关键词:基于多源UGC数据的健康领域知识图谱构建,,由笔耕文化传播整理发布。



本文编号:344208

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/344208.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b6e03***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com