在线糖尿病社区基于文本挖掘的帖子主题和情感分析
发布时间:2021-11-25 13:06
随着社会和互联网技术的发展,人们越来越关注自身的健康状况,相对于传统单方面接受医生诊疗意见的医疗保健方式,越来越多的人们参与到了主动的自我健康管理当中,在线健康社区的出现满足了人们在信息搜寻以及从交流互动中获得情感支持的需求。在线健康社区提供给患者跨地域地与医生、病友沟通的平台,并且更好地整合医疗资源得以给患者使用,近年来得到了蓬勃的发展。在线糖尿病社区作为针对糖尿病患者的在线健康社区,已经成为糖尿病病人搜寻相关疾病和药物信息以及进行情感倾诉的重要平台。目前在线糖尿病社区的研究对象都是以二型糖尿病患者为主,但一型糖尿病患者作为更特殊的患病群体,对其在社区中的主题探索和情感分析尤其重要。本文基于在线糖尿病社区(甜蜜家园)一型糖尿病版块的用户发帖数据,利用主题分析和情感分析方法,研究在线糖尿病社区中的用户所讨论的主题和表达情感的偏好,并对社区用户进一步分类,通过对用户参与度分类和性别分类,进一步探索不同聚类人群发帖主题和情感表达的差异。结果表明:(1)一型糖尿病社区中患者讨论的主题分为八类:患者间沟通,仪器使用,日常饮食,家庭生活,请求帮助,症状描述,情感表达,生活与工作。(2)一型糖尿病...
【文章来源】:昆明理工大学云南省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
研究技术路线图
昆明理工大学硕士学位论文在线糖尿病社区基于文本挖掘的帖子主题和情感分析16图3-1.甜蜜家园糖尿病知识板块区图3-2.甜蜜家园“一型糖尿脖板块网页结构数据获取及处理过程如下:基于Python语言设计了爬虫程序,从一型糖尿病板块爬取用户发帖数据信息。该爬虫程序通过Web页面,采集了该论坛中1型糖尿病板块中用户发帖及回帖文本内容、帖子查看、回复量以及时间戳,以及用户的个人资料,其中包括用户ID、空间访问量、好友数量、记录数、日志数、回帖数、主题数、分享数、治疗方案、性别、居住地、签到详情、活跃概况。
昆明理工大学硕士学位论文在线糖尿病社区基于文本挖掘的帖子主题和情感分析16图3-1.甜蜜家园糖尿病知识板块区图3-2.甜蜜家园“一型糖尿脖板块网页结构数据获取及处理过程如下:基于Python语言设计了爬虫程序,从一型糖尿病板块爬取用户发帖数据信息。该爬虫程序通过Web页面,采集了该论坛中1型糖尿病板块中用户发帖及回帖文本内容、帖子查看、回复量以及时间戳,以及用户的个人资料,其中包括用户ID、空间访问量、好友数量、记录数、日志数、回帖数、主题数、分享数、治疗方案、性别、居住地、签到详情、活跃概况。
本文编号:3518200
【文章来源】:昆明理工大学云南省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
研究技术路线图
昆明理工大学硕士学位论文在线糖尿病社区基于文本挖掘的帖子主题和情感分析16图3-1.甜蜜家园糖尿病知识板块区图3-2.甜蜜家园“一型糖尿脖板块网页结构数据获取及处理过程如下:基于Python语言设计了爬虫程序,从一型糖尿病板块爬取用户发帖数据信息。该爬虫程序通过Web页面,采集了该论坛中1型糖尿病板块中用户发帖及回帖文本内容、帖子查看、回复量以及时间戳,以及用户的个人资料,其中包括用户ID、空间访问量、好友数量、记录数、日志数、回帖数、主题数、分享数、治疗方案、性别、居住地、签到详情、活跃概况。
昆明理工大学硕士学位论文在线糖尿病社区基于文本挖掘的帖子主题和情感分析16图3-1.甜蜜家园糖尿病知识板块区图3-2.甜蜜家园“一型糖尿脖板块网页结构数据获取及处理过程如下:基于Python语言设计了爬虫程序,从一型糖尿病板块爬取用户发帖数据信息。该爬虫程序通过Web页面,采集了该论坛中1型糖尿病板块中用户发帖及回帖文本内容、帖子查看、回复量以及时间戳,以及用户的个人资料,其中包括用户ID、空间访问量、好友数量、记录数、日志数、回帖数、主题数、分享数、治疗方案、性别、居住地、签到详情、活跃概况。
本文编号:3518200
本文链接:https://www.wllwen.com/guanlilunwen/shequguanli/3518200.html