基于时空感知的健康信息发现技术研究
本文关键词:基于时空感知的健康信息发现技术研究,,由笔耕文化传播整理发布。
【摘要】:互联网时代信息技术推动健康领域革命性的变革使得人们不但对生活质量的要求越来越高还对个人和家庭的健康也越来越重视;人们不再满足于不生疾病,而到更关注预防疾病和保健。虽然现代人对健康的关注意识比以往任何时候都强烈,但是在如何健康地饮食,如何科学地预防疾病,以及慢性疾病发生时如何长期地监控疾病等方面,大多数人还是处于一个不甚了解的状态。因此,近年来信息技术在医疗健康领域的研究也越来越多,出现了很多的个人健康管理软件和穿戴式移动健康设备等硬件,它们管理和存储健康数据,为更好地利用健康数据和为用户提供服务奠定了良好的基础。在日常生活中时间信息和空间信息与我们息息相关,在通常的信息搜索中,我们也经常把时间和空间信息作为关键词提交给搜索引擎进行查询。在用户提交的查询中有包含了显式的时空约束和隐式的时空约束。例如,外卖网站中经常会搜索当前用户位置附近的餐厅以及最近时间卖得最热的菜品等等。可想而知,这些与时间和位置相关的查询中,如果脱离了时间和空间信息,其检索结果将是很糟糕的。现今互联网信息呈现出爆炸式增长,从海量的信息中快速查找到真正需要的信息已变得十分困难,因此普通检索不能很好地理解用户的查询意图,于是就衍生出了信息发现技术。基于以上背景,本文针对现有的信息发现技术在时空感知搜索能力方面还比较弱的现状,研究了时空感知的信息发现技术及其在健康领域的应用,提出了一系列的方法。本文首先阐述了信息发现和时空感知的相关理论以及国内外研究现状,分析了时空感知的信息发现研究中存在的问题;然后提出了基于时空感知的信息发现模型;最后在信息发现模型的基础上设计了健康信息抽取算法和基于时空感知的信息发现算法-STAORank算法。STAORank算法是基于ObjectRank算法的改进,在其中扩展了时间相似度和空间相似度的计算以及健康数据的关联性。STAORank算法首先查询出包含文本关键词的结点集;其次,在健康数据图上搜索满足时间和空间约束的结点,并产生候选结果;最后,对候选结果集利用评分公式计算相应的最终分数进行堆排序得出Top-k个结果。本文运用上述方法实现了一个基于时空感知的健康信息发现原型系统并抽取了大量的健康数据。本文使用了P@k评价指标以及查询时间两个指标对比和分析了不同算法的实验结果。实验结果表明,本文设计的STAORank算法具有良好的检索效果。
【关键词】:时空感知 信息发现 健康信息发现
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要5-7
- Abstract7-12
- 第1章 绪论12-19
- 1.1 研究背景及研究意义12-13
- 1.2 国内外研究现状13-17
- 1.2.1 信息发现研究现状13-14
- 1.2.2 时空感知的信息发现研究现状14-17
- 1.3 主要研究内容17
- 1.4 论文章节安排17-19
- 第2章 时空感知与健康信息发现相关技术19-26
- 2.1 信息发现相关理论19-20
- 2.1.1 信息发现相关定义19
- 2.1.2 信息发现原理19-20
- 2.2 时空感知相关理论20-24
- 2.2.1 时空感知相关定义20-22
- 2.2.3 时空感知的应用22-24
- 2.3 时空感知模型24-25
- 2.4 本章小结25-26
- 第3章 健康信息抽取技术26-45
- 3.1 健康信息抽取总体框架26-27
- 3.2 健康实体抽取27-30
- 3.2.1 网站结构分析27-28
- 3.2.2 实体抽取规则设计28-29
- 3.2.3 实体抽取算法设计29-30
- 3.3 健康实体属性抽取30-36
- 3.3.1 网页结构分析30-32
- 3.3.2 实体属性抽取规则设计32-33
- 3.3.3 实体属性抽取算法设计33-35
- 3.3.4 实体属性一致性检查35-36
- 3.4 健康实体联系抽取36-40
- 3.4.1 实体联系抽取规则设计37-38
- 3.4.2 实体联系抽取算法设计38-40
- 3.4.3 一致性检查40
- 3.5 实验结果与分析40-44
- 3.5.1 评价标准40-41
- 3.5.2 抽取结果分析41-44
- 3.6 本章小结44-45
- 第4章 基于时空感知的健康信息发现算法45-64
- 4.1 时空感知的预处理45-46
- 4.2 基于时空感知的健康信息发现总体框架46-47
- 4.3 基于时空感知的健康信息发现模型47-50
- 4.3.1 信息发现模型47-48
- 4.3.2 查询处理机制48-49
- 4.3.3 信息发现的结果定义49-50
- 4.4 信息发现算法设计与分析50-58
- 4.4.1 基本思路50-51
- 4.4.2 工作流程51-52
- 4.4.3 STAORank算法52-54
- 4.4.4 时间相似度算法54-56
- 4.4.5 位置相似度算法56-57
- 4.4.6 算法分析57-58
- 4.5 信息发现结果排序策略58-59
- 4.5.1 基本思路58
- 4.5.2 排序算法58-59
- 4.6 实验结果与分析59-63
- 4.6.1 评估方法59
- 4.6.2 实验设置59-60
- 4.6.3 结果分析60-63
- 4.7 本章小结63-64
- 第5章 原型系统设计与实现64-75
- 5.1 系统分析与设计64-67
- 5.1.1 系统总体架构设计64-65
- 5.1.2 系统模块设计65-67
- 5.2 系统实现67-74
- 5.2.1 开发工具67-69
- 5.2.2 数据存储69-72
- 5.2.3 功能实现72-74
- 5.3 本章小结74-75
- 第6章 总结与展望75-76
- 6.1 论文总结75
- 6.2 工作展望75-76
- 参考文献76-80
- 攻读学位期间公开发表论文80-81
- 致谢81
【相似文献】
中国期刊全文数据库 前10条
1 乔磊;李存华;仲兆满;王俊;刘冬冬;;基于规则的人物信息抽取算法的研究[J];南京师大学报(自然科学版);2012年04期
2 于琨,糜仲春,蔡庆生;可应用于互联网的自学习中文关键词抽取算法[J];中国科学技术大学学报;2002年03期
3 赵鹏;蔡庆生;王清毅;耿焕同;;一种基于复杂网络特征的中文文档关键词抽取算法[J];模式识别与人工智能;2007年06期
4 胡志敏;;基于综合权重的多文档关键词抽取算法[J];计算机与数字工程;2010年06期
5 袁晓峰;;基于词语相关度的文档主题抽取算法[J];成都大学学报(自然科学版);2012年04期
6 沈媛媛;刘益成;郑恭明;;利用VBA在Word中实现试卷的自动生成[J];电脑学习;2007年01期
7 傅继彬;樊孝忠;毛金涛;余正涛;;基于语言特性的中文领域术语抽取算法[J];北京理工大学学报;2010年03期
8 刘云峰;;基于标签路径聚类的文本信息抽取算法[J];计算机工程;2010年12期
9 沈元一;郑骁庆;顾轶灵;;基于语义的互联网药品信息抽取算法[J];计算机系统应用;2011年01期
10 胡佳妮;郭军;邓伟洪;徐蔚然;;基于短文本的独立语义特征抽取算法[J];通信学报;2007年12期
中国重要会议论文全文数据库 前4条
1 穆亚东;周秉锋;;基于信念传播的图像抽取算法[A];中国感光学会第七次全国会员代表大会暨学术年会和第七届青年学术交流会论文摘要集[C];2006年
2 胡佳妮;郭军;徐蔚然;;一种基于短文本的独立语义特征抽取算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
3 周毅;;基于逻辑行列切分树的表格数据抽取算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 罗勇;周超;许超;;文本分类在商品广告分类中的应用[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
中国博士学位论文全文数据库 前2条
1 张春云;实体关系抽取算法研究[D];北京邮电大学;2015年
2 姜子恒;特征构建算法及其在图像语义标注与信息抽取中的应用研究[D];北京理工大学;2015年
中国硕士学位论文全文数据库 前10条
1 张策;基于web的改进信息抽取算法的设计与实现[D];电子科技大学;2014年
2 李汝君;基于时空感知的健康信息发现技术研究[D];大连海事大学;2016年
3 沈元一;互联网药品信息抽取算法的研究[D];复旦大学;2010年
4 周赵鹏;基于互联网的构件库系统构件描述信息抽取算法研究[D];华中科技大学;2012年
5 韩雪娇;英语试题关键词抽取算法研究[D];北方工业大学;2013年
6 丁溪源;基于大规模语料的中文新词抽取算法的设计与实现[D];南京理工大学;2011年
7 李兴东;智能抽取算法在专家库抽取系统中的应用研究[D];吉林大学;2013年
8 柳凌燕;基于免疫规划的图像情感规则抽取算法的研究[D];太原理工大学;2010年
9 张鹏;中文意见挖掘的特征层次构建和抽取算法[D];重庆大学;2010年
10 王敬普;基于包装器模型的文本信息抽取算法研究[D];湖南大学;2006年
本文关键词:基于时空感知的健康信息发现技术研究,由笔耕文化传播整理发布。
本文编号:338206
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/338206.html