基于互联网医疗大数据的中国居民睡眠障碍影响因素分析
发布时间:2025-04-01 06:08
目的以互联网医疗平台中的睡眠障碍人群为研究对象,分析睡眠障碍人群基本特征,从个体与社会两个层面研究睡眠障碍人群的影响因素,为健康睡眠工程提供借鉴意义和决策依据。方法通过对互联网医疗行业进行调查,并结合专业领域的研究报告选取主流的互联网医疗平台中睡眠障碍人群为研究对象。运用网络数据采集技术获取2017年度睡眠障碍人群的医疗服务数据,对数据进行预处理后,采用文本数据挖掘从个体层面分析睡眠障碍的影响因素。采用SPSS软件多元回归分析从社会层面分析睡眠障碍的社会经济环境影响因素。结果在31876个有效样本数据中,年龄小于5岁、5-14岁、15-24岁、25-34岁、35-44岁、45-59岁、60岁以上的人数分别为477、1744、12742、8084、4190、3501和1138,15-34岁人群在总人群中的占比为65.4%。所有睡眠障碍人群中,女性人数为18557人,所占比例为58.2%;从个体层面分析得出睡眠障碍人群的主要影响因素为神经衰弱、体虚症、心理因素、躯体疾病及外界压力;从社会层面分析得出区睡眠障碍的发病率与第二产业值、第三产业值、工业增加值、城市照明路灯数量、金融业增加值、居民消...
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
本文编号:4039037
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
图2.1待爬取页面结构图
图2.1待爬取页面结构图假设列表页L总共有200页,每一页有20个标题链接T,可看成队列,随着时间的推移,旧的标题链接页从右侧移出,接从左侧进入。假设最近一次爬取的最后一个标题链接为Li
图2.1待爬取页面结构图
目前存在一些开源的爬虫框架,如Nutch、Heritrix、Scrapy[40-42]等。对于研究者而言,通过手动编程亦可获取网络数据。本文利用python语言编程获取互联网医疗平台数据,采集的数据均为列表结构的数据集。由于列表的更新频率是动态变化的,为了避免重复爬取已经获取的列....
图2.2有向无环图
2)利用动态规划算法寻找DAG中的最大概率路径,找出基于词频的最大概率切分组合:例如:字串Z=‘有力保障’可以拆分成W1=‘有力/保/障’,W2=‘有力/保障’,最大概率分词就是要求得所有拆分组合中概率最大的组合,即Max(P(W1|Z),P(W2|Z)),根据贝叶斯公式P(W|....
图2.3分类规则树
通过界定特征词可以发现语义规律,当患者的描述文本中包含“睡不着”、“难睡着”、“醒”等词,分类程序即可抽取出表现形式。但特征词匹配并不是万能的,这是因为中文的表达灵活自由,解决方式为:从以上特征词中抽取出特征字,构建多个语义规则树,能够有效提升信息抽取的准确率。例如针对描述文本“....
本文编号:4039037
本文链接:https://www.wllwen.com/linchuangyixuelunwen/4039037.html
上一篇:彩色多普勒超声在血液透析患者自体动静脉内瘘血流量测量中的应用
下一篇:没有了
下一篇:没有了
最近更新
教材专著