基于CWK-means的在线学习资源质量分析系统的设计与实现
发布时间:2021-08-25 12:56
随着互联网+教育的飞速发展,在线学习受到大众的欢迎,与此同时在线学习资源大量涌现,但学习资源的质量难以把控,不利于学习者学习,直接影响在线学习的质量。因此,准确的分析并提高在线学习资源的质量,对提高用户满意度、帮助在线学习平台的长远发展具有重要的意义。为了能够精准地分析在线学习资源的质量,论文结合研究内容的特征使用K-means算法作为在线学习资源的聚类算法,并根据K-means算法的优缺点对其进行改进。论文将改进的K-means算法应用到在线学习资源质量分析中,设计并实现了在线学习资源质量分析系统。论文的主要工作如下:(1)提出了CWK-means算法。论文针对K-means在聚类过程中会有一些属性影响聚类结果,提出增加权重因素;对初始聚类中心比较敏感,随机选取初始聚类中心可能会陷入局部最优解的情况,提出了初始聚类中心选取方法。将这两点改进融入到K-means算法中,最终提出了基于权重的初始聚类中心的K-means算法(简称CWK-means算法)。论文详细介绍了CWK-means的算法思想和步骤,最后通过实验证实了CWK-means算法的有效性,该算法在学习资源数据集中的平均聚类精...
【文章来源】:江苏大学江苏省
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
数据点分布对比图
江苏大学工程硕士学位论文19Step2数据对象(∈[1,])对应的距离密度,计算公式如下:ddf()=∑(,)∑(,)=1=1(3.13)Step3计算数据点(∈[1,])的有效区域半径,为领域半径调节系数,计算公式如下:=×1∑()=1(3.14)Step4计算以数据对象点密度(),计算公式如下:()=|{|(,)≤,∈}|(3.15)Step5选取点密度最大的数据点作为第一个初始聚类中心C1,再选取和C1距离超过R1的且密度仅次于C1的第二个初始聚类中心C2,重复选取初始聚类中心,直到找到K个聚类中心。3.3K值的确定使用手肘法能够较为直观的得到K的取值。其基本思想是:从K=2开始,K的取值逐渐增大,数据集会被划分的更加精准,簇的聚合程度变高,SSE变小,当聚类个数小于实际聚类个数时,K增大SSE会大幅度减小,聚类个数等于实际聚类个数时,SSE减小的程度趋于平缓[47]。SSE和K的关系图如图3.2所示,两者的关系可以在图中清楚地发现类似一个手肘的形状,而这个肘部对应的K值就是数据的实际聚类数。图3.2手肘法示意图
江苏大学工程硕士学位论文23法,在这样的情况下CWK-means算法时间上的牺牲是值得的。下面以haberman数据集为例,原始分布如图3.4所示,本文提出的CWK-means算法和其他三种对比算法的聚类效果如图3.5所示。从数据点的分布情况看CWK-means算法的聚类效果明显优于其他两种算法略逊色于基于权重距离的K-means算法。图3.4Haberman数据集分布图(a)K-means(b)基于密度的K-means(c)基于权重距离的K-means(d)CWK-means图3.5haberman数据集聚类结果
【参考文献】:
期刊论文
[1]基于改进的K-means聚类的多区域物流中心选址算法[J]. 鲁玲岚,秦江涛. 计算机系统应用. 2019(08)
[2]基于改进K-medoids的聚类质量评价指标研究[J]. 邹臣嵩,段桂芹. 计算机系统应用. 2019(06)
[3]基于加权质量评价函数的K-means图像分割算法[J]. 刘长齐,邵堃,霍星,范冬阳,檀结庆. 计算机科学. 2019(S1)
[4]聚类算法综述[J]. 章永来,周耀鉴. 计算机应用. 2019(07)
[5]基于DTW距离度量的层次聚类算法[J]. 陶洋,邓行,杨飞跃,潘蕾娜. 计算机工程与设计. 2019(01)
[6]改进的K-means聚类k值选择算法[J]. 王建仁,马鑫,段刚龙. 计算机工程与应用. 2019(08)
[7]高职“个性化学习微课”的质量评判分析[J]. 蒋勇,张朝霞. 职教论坛. 2018(08)
[8]基于空间距离自适应权重度量的粗糙K-means算法[J]. 王慧研,张腾飞,马福民. 计算机科学. 2018(07)
[9]国内高校在线课程建设理念演化——兼论“互联网+教育”生态体系构建[J]. 许欢,张诗亚,罗江华. 现代远程教育研究. 2018(03)
[10]基于AHP和混合Apriori-Genetic算法的交通事故成因分析模型[J]. 邓晓衡,曾德天. 计算机应用研究. 2019(06)
硕士论文
[1]基于个性化推荐的在线学习系统研究与实现[D]. 巩晓悦.北京邮电大学 2019
[2]基于Android的在线学习系统的设计与实现[D]. 李乔.吉林大学 2018
[3]学习行为分析与学业预警系统研究与设计[D]. 孙昊.苏州大学 2017
[4]基于网络学习行为分析的评价模型研究[D]. 李念.华中师范大学 2007
本文编号:3362155
【文章来源】:江苏大学江苏省
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
数据点分布对比图
江苏大学工程硕士学位论文19Step2数据对象(∈[1,])对应的距离密度,计算公式如下:ddf()=∑(,)∑(,)=1=1(3.13)Step3计算数据点(∈[1,])的有效区域半径,为领域半径调节系数,计算公式如下:=×1∑()=1(3.14)Step4计算以数据对象点密度(),计算公式如下:()=|{|(,)≤,∈}|(3.15)Step5选取点密度最大的数据点作为第一个初始聚类中心C1,再选取和C1距离超过R1的且密度仅次于C1的第二个初始聚类中心C2,重复选取初始聚类中心,直到找到K个聚类中心。3.3K值的确定使用手肘法能够较为直观的得到K的取值。其基本思想是:从K=2开始,K的取值逐渐增大,数据集会被划分的更加精准,簇的聚合程度变高,SSE变小,当聚类个数小于实际聚类个数时,K增大SSE会大幅度减小,聚类个数等于实际聚类个数时,SSE减小的程度趋于平缓[47]。SSE和K的关系图如图3.2所示,两者的关系可以在图中清楚地发现类似一个手肘的形状,而这个肘部对应的K值就是数据的实际聚类数。图3.2手肘法示意图
江苏大学工程硕士学位论文23法,在这样的情况下CWK-means算法时间上的牺牲是值得的。下面以haberman数据集为例,原始分布如图3.4所示,本文提出的CWK-means算法和其他三种对比算法的聚类效果如图3.5所示。从数据点的分布情况看CWK-means算法的聚类效果明显优于其他两种算法略逊色于基于权重距离的K-means算法。图3.4Haberman数据集分布图(a)K-means(b)基于密度的K-means(c)基于权重距离的K-means(d)CWK-means图3.5haberman数据集聚类结果
【参考文献】:
期刊论文
[1]基于改进的K-means聚类的多区域物流中心选址算法[J]. 鲁玲岚,秦江涛. 计算机系统应用. 2019(08)
[2]基于改进K-medoids的聚类质量评价指标研究[J]. 邹臣嵩,段桂芹. 计算机系统应用. 2019(06)
[3]基于加权质量评价函数的K-means图像分割算法[J]. 刘长齐,邵堃,霍星,范冬阳,檀结庆. 计算机科学. 2019(S1)
[4]聚类算法综述[J]. 章永来,周耀鉴. 计算机应用. 2019(07)
[5]基于DTW距离度量的层次聚类算法[J]. 陶洋,邓行,杨飞跃,潘蕾娜. 计算机工程与设计. 2019(01)
[6]改进的K-means聚类k值选择算法[J]. 王建仁,马鑫,段刚龙. 计算机工程与应用. 2019(08)
[7]高职“个性化学习微课”的质量评判分析[J]. 蒋勇,张朝霞. 职教论坛. 2018(08)
[8]基于空间距离自适应权重度量的粗糙K-means算法[J]. 王慧研,张腾飞,马福民. 计算机科学. 2018(07)
[9]国内高校在线课程建设理念演化——兼论“互联网+教育”生态体系构建[J]. 许欢,张诗亚,罗江华. 现代远程教育研究. 2018(03)
[10]基于AHP和混合Apriori-Genetic算法的交通事故成因分析模型[J]. 邓晓衡,曾德天. 计算机应用研究. 2019(06)
硕士论文
[1]基于个性化推荐的在线学习系统研究与实现[D]. 巩晓悦.北京邮电大学 2019
[2]基于Android的在线学习系统的设计与实现[D]. 李乔.吉林大学 2018
[3]学习行为分析与学业预警系统研究与设计[D]. 孙昊.苏州大学 2017
[4]基于网络学习行为分析的评价模型研究[D]. 李念.华中师范大学 2007
本文编号:3362155
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3362155.html