基于最小风险贝叶斯的垃圾博客识别算法研究
[Abstract]:In order to solve the problem of high loss of spam blog in the current research of blog identification, a new algorithm based on minimum risk Bayesian is proposed. The algorithm extracts multi-structure features, introduces risk factors into naive Bayes classification method, and classifies spam blogs and normal blogs by minimizing the risk. The experimental results show that the algorithm can further reduce the error rate and improve the recognition accuracy under the condition that the effect on recall rate is very small. Compared with the naive Bayes method, the accuracy is improved by nearly 5 percentage points, and the performance of the proposed method is close to that of the support vector machine method.
【作者单位】: 长治学院计算机系;山西大学计算机与信息技术学院;
【基金】:国家自然科学基金(61100138) 山西省自然科学基金(2011011016-2);山西省自然科学基金(2011011014-2) 山西省高校科技开发项目(20121117) 山西省科技基础条件平台建设项目(2012091003-0105)
【分类号】:TP393.092;TP391.1
【参考文献】
相关期刊论文 前6条
1 刘延华;陈国龙;;中文垃圾邮件多层次过滤技术的应用研究[J];计算机工程与应用;2009年34期
2 任永功;尹明飞;杨荣杰;;基于组合特征的动态垃圾博客过滤算法[J];计算机科学;2012年05期
3 刘玮;廖祥文;许洪波;王丽宏;;基于统计特征的垃圾博客过滤[J];中文信息学报;2008年06期
4 ;中国互联网整体网民发展状况——《第31次中国互联网发展状况调查报告(上)》[J];互联网天地;2013年01期
5 何苑;谭红叶;;基于多结构特征的垃圾博客识别研究[J];计算机工程与设计;2010年22期
6 曾岳;冯大政;付达杰;;最小风险贝叶斯决策的二值化人脸识别算法[J];计算机工程与设计;2011年10期
【共引文献】
相关期刊论文 前10条
1 李爱军,罗四维,刘蕴辉,黄华;信息理论框架下的神经网络构建[J];北京交通大学学报;2005年02期
2 王宇晖;业宁;沈丽容;;单翼分解下的纯度函数失效分析[J];北京交通大学学报;2009年06期
3 冯志新;蔡玉俊;黎振;潘鑫;;基于k-均值聚类算法的模具型腔曲面分片加工研究[J];北京工业大学学报;2012年05期
4 王瑜;穆志纯;徐正光;骆佳佳;;基于核典型相关分析的姿态人耳、人脸多模态识别[J];北京科技大学学报;2008年10期
5 裴晓梅;郑崇勋;;基于Adaboost技术的大脑运动意识任务分类[J];北京生物医学工程;2008年05期
6 王兰莎;张国英;沙芸;;复杂矿石图像的特征提取与聚类[J];北京石油化工学院学报;2010年04期
7 张世博;周义明;;一种优化初始化中心的k均值web信息聚类算法[J];北京石油化工学院学报;2011年04期
8 唐玉志;马远良;蔡宗义;吴祖堂;王占江;;地下化学爆炸地运动信号关联探索[J];爆炸与冲击;2009年05期
9 刘茂;;一种基于模糊神经网的超短波信号自动识别算法[J];成都信息工程学院学报;2007年05期
10 岳素青;蔡琼;;加权SOM神经网络在水文分区中的应用[J];赤峰学院学报(自然科学版);2009年03期
相关会议论文 前6条
1 林达真;李绍滋;;基于模式分类的汉语时态确定方法研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 卫颖奇;彭进业;;一种基于混合模型的特征提取方法[A];第三届全国嵌入式技术和信息处理联合学术会议论文集[C];2009年
3 张星星;黎宁;李文灿;;基于水表自动判读系统的半字识别算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 欧阳琰;桑农;;基于面部动作单元组合特征的表情识别[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 刘尊洋;汪作来;王自荣;余大斌;孙晓泉;;基于谱系法改进FCM的仿造迷彩主色提取方法[A];第九届全国光电技术学术交流会论文集(上册)[C];2010年
6 施聪莺;;基于规则和Rocchio分类器的学前综合教育资源分类[A];全国计算机辅助教育学会“计算机辅助教育软件开发与应用”研讨会论文集[C];2009年
相关博士学位论文 前10条
1 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
2 李一啸;基于复杂网络和演化博弈理论的社会[D];浙江大学;2010年
3 罗向阳;数字图像隐写检测关键问题研究[D];解放军信息工程大学;2010年
4 彭建芬;P2P流量识别关键技术研究[D];北京邮电大学;2011年
5 薛洋;基于单个加速度传感器的人体运动模式识别[D];华南理工大学;2011年
6 蒋胜利;高维数据的特征选择与特征提取研究[D];西安电子科技大学;2011年
7 李剑;PSTN话带数据分离与调制识别[D];解放军信息工程大学;2009年
8 薛富强;进化RBF神经网络分类器研究[D];解放军信息工程大学;2009年
9 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
10 程环环;基于贝叶斯网络的图像内容表述与分类[D];国防科学技术大学;2011年
相关硕士学位论文 前10条
1 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
2 叶铂;基于统计学方法的水面目标特征提取与识别方法的研究[D];哈尔滨工程大学;2010年
3 张宝华;支持向量机在入侵检测系统中的研究和应用[D];天津理工大学;2010年
4 刘怀愚;静态图像的车辆检测算法研究[D];淮北师范大学;2010年
5 张云鹏;发动机机械故障诊断系统特征提取算法研究[D];长春工业大学;2010年
6 熊超;视频图像中运动车辆检测与跟踪技术的研究[D];南昌大学;2010年
7 兰远鸽;基于SAR影像的变化检测技术研究[D];解放军信息工程大学;2010年
8 杨大海;极化SAR相干斑抑制若干问题研究[D];解放军信息工程大学;2010年
9 苏畅;基于计算机视觉的木材表面缺陷检测研究[D];中南林业科技大学;2008年
10 吴赛;单目摄像机场景深度估计及数字识别算法研究[D];浙江大学;2011年
【二级参考文献】
相关期刊论文 前10条
1 张付志;伍朝辉;姚芳;;基于贝叶斯算法的垃圾邮件过滤技术的研究与改进[J];燕山大学学报;2009年01期
2 武京伟;黄春庆;;一种基于改进弹性束图匹配的人脸识别[J];工业控制计算机;2009年09期
3 赵韩;姜康;曹文钢;孙丙宇;;用小波变换和Fisher判别对人脸进行特征提取[J];哈尔滨工业大学学报;2009年11期
4 张忠波,马驷良,董险峰;基于局部特征分析与最优化匹配的人脸识别算法[J];吉林大学学报(理学版);2005年01期
5 蒋加伏;袁承伟;;融合PCA与LDA变换的仿生人脸识别研究[J];计算机工程与应用;2010年19期
6 顾明;;基于模糊ART神经网络的在线人脸识别模型的设计和实现[J];计算机科学;2007年08期
7 谢毓湘;王卫威;栾悉道;吴玲达;老松杨;;基于肤色与模板匹配的人脸识别[J];计算机工程与科学;2008年06期
8 李健;李鹏坤;师永刚;;基于自由形状变形的三维人脸表情控制[J];计算机工程与科学;2010年03期
9 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
10 王斌,潘文锋;基于内容的垃圾邮件过滤技术综述[J];中文信息学报;2005年05期
【相似文献】
相关期刊论文 前7条
1 毛华;赵小娜;毛晓亮;;危险品运输中的最小风险最大流算法[J];计算机工程;2012年09期
2 王科欣;徐辉;;基于最小错误率与最小风险的贝叶斯分类比较与研究[J];科技信息;2009年23期
3 迟晓君,孟庆春,陈鹏;基于最小风险的Bayes决策方法在交通检测中的应用[J];计算机应用研究;2005年12期
4 袁国强;肖倩;刘强;;带有最小风险准则的两阶段模糊运输模型[J];计算机工程与应用;2011年35期
5 张春燕;陈笋;张俊峰;李潭;;基于最小风险贝叶斯分类器的茶叶茶梗分类[J];计算机工程与应用;2012年28期
6 杜京义;候媛彬;;基于最小风险的SVM及其在故障诊断中的应用[J];振动、测试与诊断;2006年02期
7 ;[J];;年期
相关硕士学位论文 前3条
1 赵小娜;危险品运输中的最小风险流[D];河北大学;2013年
2 刘颖;带有补偿问题的两阶段模糊最小风险问题性质的研究[D];河北大学;2008年
3 田苗;模糊最小风险问题的逼近方法与应用[D];河北大学;2008年
,本文编号:2420331
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2420331.html