在线健康问答社区中食材对疾病作用关系的知识挖掘研究
发布时间:2021-08-12 16:30
随着人们健康管理意识的提高,人们正在进行着积极的自我健康管理。在线健康问答社区为医患交流和人们获取基本健康医疗知识提供了途径。在线健康社区中囊括了大量的医患问答。这些问答兼具社交媒体数据的覆盖广,更新速度快,信息良莠不齐,内容贴近病患的日常健康管理需要等特点。因此,基于在线健康社区挖掘的知识对于主流的文献知识具有互补性,可以发现最新的健康医学知识。本文采用寻医问药网社区问答数据,研究如何从在线健康社区中挖掘健康管理知识,主要包括知识的自动化提取和知识质量的可靠性评估。具体来说,首先以疾病与食材作用关系为例研究在线健康社区的知识自动化提取。采取多源词典匹配进行实体名识别,卷积神经网络方法进行关系分类,提取了常见30种疾病与215种食材的作用关系。实证显示模型效果显著,其F1(兼顾准确率和召回率的综合指标)为0.80,而人工标注的准确率为0.84,支持向量机的F1为0.74。在此基础上,本文对所抽取知识的可靠性进行评估。在评估方法上,文章构造了文本特征,时间特征,问答关联性特征,回答者个人信息特征,搜索引擎驱动的特征,话题特征;采取机器学习方法进行答案的自动化评价。实证发现这些特征可以显著...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
寻医问药网上医生回答页面
图 3- 2 关系提取流程的示意图Fig.3-2 process diagram of relation extraction食材名识别提取之前,需要对文中出现的实体名进行识别。采取扩展辞典与启料中出现的疾病名称和中药名称。
句子的向量化表示Fig.3-3Vectorrepresentationofsentence
【参考文献】:
期刊论文
[1]基于文本挖掘的问答社区健康信息行为研究——以“百度知道”为例[J]. 邓胜利,刘瑾. 信息资源管理学报. 2016(03)
[2]社会化问答网站答案认可度的影响因素研究——以知乎为例[J]. 施国良,陈旭,杜璐锋. 现代情报. 2016(06)
[3]多特征层次化答案质量评价方法研究[J]. 崔敏君,段利国,李爱萍. 计算机科学. 2016(01)
[4]在线问答社区信息质量评价研究综述[J]. 姜雯,许鑫. 现代图书情报技术. 2014(06)
[5]社会化问答平台的答案质量评估——以“知乎”、“百度知道”为例[J]. 贾佳,宋恩梅,苏环. 信息资源管理学报. 2013(02)
[6]基于相似度的问答社区问答质量评价方法[J]. 来社安,蔡中民. 计算机应用与软件. 2013(02)
[7]网络社区信息质量及可靠性评价研究——基于用户视角[J]. 沈旺,国佳,李贺. 现代图书情报技术. 2013(01)
[8]社区问答系统中“问答对”的质量评价[J]. 刘高军,马砚忠,段建勇. 北方工业大学学报. 2012(03)
[9]中文社区问答中问题答案质量评价和预测[J]. 李晨,巢文涵,陈小明,李舟军. 计算机科学. 2011(06)
[10]问答社区中回答质量的评价方法研究[J]. 孔维泽,刘奕群,张敏,马少平. 中文信息学报. 2011(01)
博士论文
[1]网络健康社区中的文本挖掘方法研究[D]. 吕英杰.上海交通大学 2013
硕士论文
[1]医患问答社区文本挖掘研究[D]. 佟铁.辽宁科技大学 2015
本文编号:3338671
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
寻医问药网上医生回答页面
图 3- 2 关系提取流程的示意图Fig.3-2 process diagram of relation extraction食材名识别提取之前,需要对文中出现的实体名进行识别。采取扩展辞典与启料中出现的疾病名称和中药名称。
句子的向量化表示Fig.3-3Vectorrepresentationofsentence
【参考文献】:
期刊论文
[1]基于文本挖掘的问答社区健康信息行为研究——以“百度知道”为例[J]. 邓胜利,刘瑾. 信息资源管理学报. 2016(03)
[2]社会化问答网站答案认可度的影响因素研究——以知乎为例[J]. 施国良,陈旭,杜璐锋. 现代情报. 2016(06)
[3]多特征层次化答案质量评价方法研究[J]. 崔敏君,段利国,李爱萍. 计算机科学. 2016(01)
[4]在线问答社区信息质量评价研究综述[J]. 姜雯,许鑫. 现代图书情报技术. 2014(06)
[5]社会化问答平台的答案质量评估——以“知乎”、“百度知道”为例[J]. 贾佳,宋恩梅,苏环. 信息资源管理学报. 2013(02)
[6]基于相似度的问答社区问答质量评价方法[J]. 来社安,蔡中民. 计算机应用与软件. 2013(02)
[7]网络社区信息质量及可靠性评价研究——基于用户视角[J]. 沈旺,国佳,李贺. 现代图书情报技术. 2013(01)
[8]社区问答系统中“问答对”的质量评价[J]. 刘高军,马砚忠,段建勇. 北方工业大学学报. 2012(03)
[9]中文社区问答中问题答案质量评价和预测[J]. 李晨,巢文涵,陈小明,李舟军. 计算机科学. 2011(06)
[10]问答社区中回答质量的评价方法研究[J]. 孔维泽,刘奕群,张敏,马少平. 中文信息学报. 2011(01)
博士论文
[1]网络健康社区中的文本挖掘方法研究[D]. 吕英杰.上海交通大学 2013
硕士论文
[1]医患问答社区文本挖掘研究[D]. 佟铁.辽宁科技大学 2015
本文编号:3338671
本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/3338671.html