当前位置:主页 > 经济论文 > 电子商务论文 >

基于正则化朴素贝叶斯的用户分类算法的研究

发布时间:2020-02-06 01:22
【摘要】:推荐系统在电子商务和信息推送等场合有十分重要的应用,它把训练数据中的用户进行预分类,然后根据用户预分类结果,判断一个具体用户的个人偏好并推送个性化服务信息,提高了用户的体验满意度。朴素贝叶斯分类器具有优良的分类性能,已被应用在推荐系统的用户分类中,但由于推荐系统的训练数据集存在高维度、不完备等问题,导致用户分类的精度、计算时间、抗噪音干扰等性能不佳。针对这些问题,本文研究使用Shrinkage正则化技术改进朴素贝叶斯分类算法,提出正则化朴素贝叶斯用户分类算法,主要研究内容如下:高斯朴素贝叶斯相当于一个对角协方差的朴素贝叶斯分类器,一定程度上减弱样本属性条件独立假设对分类结果的负面影响,但数据样本联合概率估计误差大的问题仍存在。在训练数据时,在高斯密度函数中引入罚因子和Shrinkage正则化方法,自动调整属性条件的权重,将非关键属性的权重降低,使协方差估计值接近原矩阵向量,避免过拟合,减小样本联合概率估计的误差,从而改善算法的分类效果,提高了分类精度。应用Adaptive Boosting(Ada Boost)自适应提升算法改进正则化朴素贝叶斯用户分类器的精度。首先设定初始弱分类器权重,然后通过迭代方法,获取弱分类器的最优组合权重系统,把弱分类器组合成强分类器,提升了分类器的精度。最后将所提的算法应用于用户分类问题,在Movie-leans和UCI数据集上验证算法的可行性,并与传统朴素贝叶斯、核函数贝叶斯、支持向量机、决策树等分类算法进行比较,实验结果表明:所提算法的分类精度优于相比较的其他算法,计算时间比传统朴素贝叶斯算法有数倍的提高,本文引入Shrinkage正则化方法和Ada Boost提升技术对减少高斯贝叶斯联合概率密度误差和优化计算时间是可行的。
【图文】:

高斯分布


fW邋=邋expf^M£ZL^l逦(3-8)逡逑I邋。邋J逡逑上式为高斯分布的密度函数标准形态,高斯分布图3-1中,左侧线条均值是-4,标准差逡逑是1,右侧线条均值是6,标准差是1.5,很明显看到高斯函数被分为两部分,此刻分类逡逑出现,如果一个点出现在偏左侧区域,则该点归类为左侧类,反之则归类为右侧类。逡逑曲逡逑挺应&3?^^-.1.,么'帮於泌成.:》'?化'‘’--.、-;巧。-,?;'邋*-/邋<邋>.邋'sr->WH?sssSa?!?邋'逡逑图3-1高斯分布度逡逑Figure邋3-1邋Gaussian邋distributio打出agram逡逑由上述分析可得,如果建立了良好的高斯分布函数模型,即知道训练数据集的均但、逡逑方差,那么就可找到分类的临界点。对于朴素贝叶斯中p(x|c)可理解为C类中,X逡逑特征发生的概率一X的概率密度。那么整个高斯贝叶斯分类器架构就是:逡逑1)选取输入样本的属性特征,并采用高斯密度函数对各个类别的概率密度函数进行创逡逑建,将创建的密度函数作为先验概率;逡逑巧在预测时

对比图,准确率,对比图,算法


逦逦0.0024逦0.0072逦0.1440逦0.0017逡逑准确率逦0.5314逦0.7196逦0.9119逦0.9341逡逑soybean逦AUC逦0.9169逦0.9783逦0.9969逦0.9965逡逑-邋时间逦0.0464逦0.4950逦2.6872逦0.0092逡逑准确率逦0.9045逦0.9125逦0.9168逦0.9069逡逑balance逦AUC逦0.9570逦0.9468逦0.9845逦0.9776逡逑时间逦0.0023逦0.0076逦0.3227逦0.0020逡逑准确率逦0.9301逦0.7207逦-逦0.9416逡逑dna逦AUC逦0.W89逦0.9161逦-逦0.9920逡逑^逦0.1304逦0.3409逦-逦0.0451逡逑准确率逦0.6428逦0.7053逦-逦0.8822逡逑letter逦AUC逦0.9506逦0.9769逦-逦0.9961逡逑^逦0.0522逦0.2528逦-逦0.1712逡逑表3-3是本文算法在五个数据集情况下与其他算法在不同评价指标下的比较。逡逑
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 钱颖能;胡运发;;用朴素贝叶斯分类法选股[J];计算机应用与软件;2007年06期

2 欧阳泽华;郭华平;范明;;在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J];计算机应用;2012年01期

3 裴亚辉;熊盛武;;朴素贝叶斯及其扩展模型[J];网络安全技术与应用;2007年08期

4 赵彦琦;谢小西;荀宇畅;;朴素贝叶斯分类法的应用[J];电子制作;2013年07期

5 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期

6 王实;高文;;增强型朴素贝叶斯学习[J];计算机科学;2000年04期

7 杨忠强;秦亮曦;;一种基于属性加权的朴素贝叶斯改进算法[J];广西大学学报(自然科学版);2013年05期

8 张彩丽;杨帆;张玉杰;;柴油机供油系统状态的朴素贝叶斯诊断方法研究[J];计算机测量与控制;2008年08期

9 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期

10 王双成;冷翠平;侯彩虹;;操作风险等级预测的朴素贝叶斯方法研究[J];计算机工程与应用;2008年12期

相关会议论文 前2条

1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

2 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年

相关硕士学位论文 前10条

1 李Pr;基于朴素贝叶斯的文本分类研究及其在微博分类中的应用[D];北京理工大学;2015年

2 李冬梅;朴素贝叶斯与决策树混合分类方法的研究[D];大连海事大学;2016年

3 张帆;贝叶斯算法在校园留言板垃圾过滤中的应用研究[D];郑州大学;2016年

4 石刚;一种基于知识图谱的用户搜索意图挖掘方法的研究[D];国际关系学院;2016年

5 张予瑶;基于正则化朴素贝叶斯的用户分类算法的研究[D];广西大学;2016年

6 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年

7 刘勇华;基于朴素贝叶斯的中文段落情感分析[D];太原理工大学;2015年

8 周龙;基于朴素贝叶斯的分类方法研究[D];安徽大学;2006年

9 王翔;基于朴素贝叶斯和One-R的入侵检测问题研究[D];合肥工业大学;2008年

10 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年



本文编号:2576770

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2576770.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e75a8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com