基于随机森林算法建模的糖尿病预警系统设计与实现
发布时间:2020-07-13 16:17
【摘要】:糖尿病是一种代谢性疾病,是由于人体内胰岛素分泌不足,人体内的糖分无法代谢分解导致高血糖,严重时尿液里会检测出糖分,因此称为糖尿病。日常生活中,生活条件越来越好,人们的饮食习惯发生变化,糖尿病是富贵病的说法也不存在了。人们现在的饮食结构里不单是蛋奶肉类,还有丰富的果蔬和各式饮品甜点,正是这个原因,人们日常摄入的糖分大量增加,也导致了糖尿病发病率的增加。对于青少年也是如此,由于生活质量的提高,现在的青少年从小就是在“蜜罐”中成长的,因为家长对青少年的饮食结构的控制并不是很严格,而青少年的自制力又比较差,而高糖分的食物对青少年的吸引力极高,导致他们日常饮食摄入过多糖分,这也是导致低龄糖尿病患者越来越多的主要原因之一~([1])。另外,高龄糖尿病患者会伴随着潜在的并发症,比如心梗,眼疾等,这会给患者的身体带来更大的负担。良好规律的饮食习惯和健康绿色的生活方式才是保持正常体态以及维持身体机能正常运作的保障。因此,由于各种因素的影响,需要有一个有效机制来督促、警示,会让人们提高预防意识,那么糖尿病预警系统的研究与实现有重要意义。该预警系统的预测分析结果会及时给用户一个重要提示,促使人们及时调整和改变生活习惯或者尽早去医院就医进行更具体的检查。本文研究过程中,咨询了糖尿病专家,利用问卷调查方式收集了大量糖尿病症状属性信息。运用随机森林算法对这些信息进行相应的数据分析,建立预警模型,并将其模型运用到预警系统中。该论文的主要研究内容如下:1、通过问卷星进行问卷调查,收集了一千多份数据信息,其中包括患糖尿病的和未患糖尿病的相关属性信息,然后对这些信息进行一定的数据分析和整理,并以此作为训练样本。2、将数据样本按照3:7的比例分为训练集和测试集,运用随机森林算法对训练集进行分类训练然后通过测试集进行测试得到该随机森林算法分类的准确率,从而得到了一个预警模型,然后根据这个模型,得到一个患病概率。3、设计实现糖尿病预警系统,主要包括三个部分,第一部分是用户信息登录注册和相关个人信息处理部分;第二部分是系统的预测分析功能,分析得到用户的患病概率;第三部分是系统管理员对用户和用户信息的一些基本管理操作。4、进行算法实验和预警系统的相关测试,检验系统的有效性。利用本文研究的糖尿病预警系统,用户可以随时根据个人相关指标数据进行糖尿病的风险预测,能够有效提高糖尿病潜在患者的预防意识,通过预测分析结果,进行积极地调整,改善生活状态。
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R587.1;TP277
【图文】:
图 3-1 熵随概率的变化曲线图横坐标 p 取 0 或者取 1 时,纵坐标 H(确定性,而当横坐标 p 取值为 0.5 时,了峰值,是最大值。了对信息增益进行进一步解释的,它的
糖尿病预警问题的相关属性图
(10)糖尿病分布情况图 3-3 各个属性的分布情况图样本数据为例,主要分析患病率在每个属性变量上的分布,下面以绍。性变量的频率分布表(小数均为四舍五入),如下表 3-4 所示。表 3-4 年龄属性变量频率分布表Age 人数 占比 患病人数 该区间的患病占比35 以下 42 5% 5 11.9%36-45 312 36% 57 18.2%46-55 334 38% 79 23.7%56-65 170 19% 47 27.8%65 以上 14 2% 8 57.1%
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R587.1;TP277
【图文】:
图 3-1 熵随概率的变化曲线图横坐标 p 取 0 或者取 1 时,纵坐标 H(确定性,而当横坐标 p 取值为 0.5 时,了峰值,是最大值。了对信息增益进行进一步解释的,它的
糖尿病预警问题的相关属性图
(10)糖尿病分布情况图 3-3 各个属性的分布情况图样本数据为例,主要分析患病率在每个属性变量上的分布,下面以绍。性变量的频率分布表(小数均为四舍五入),如下表 3-4 所示。表 3-4 年龄属性变量频率分布表Age 人数 占比 患病人数 该区间的患病占比35 以下 42 5% 5 11.9%36-45 312 36% 57 18.2%46-55 334 38% 79 23.7%56-65 170 19% 47 27.8%65 以上 14 2% 8 57.1%
【相似文献】
相关期刊论文 前10条
1 沈智勇;苏
本文编号:2753688
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2753688.html