网络交易垃圾评论智能识别研究
【图文】:
建立正规增益为属性选择标准的决策树NG(A,S)=∑4t=1-pilog2pi-∑j∈value(A)SjS∑4t=1-pilog2pilog2n(2)其中pi是属于类别t的样本占总样本数的比例。Value(A)为特征A的取值集合。S和Sj分别为样本总数以及特征A取值为j的样本个数。3.3垃圾评论识别流程本文首先采用中科院计算技术研究所的ICTCLAS工具,并通过加入HowNet情感词典和自定义词典对评论语料进行分词和词性标注等预处理,再运用神经网络与决策树相结合的模型对数据进行分类。具体流程如图1所示:图1垃圾评论识别流程图—59—2016年4月第36卷第4期现代情报JournalofModernInformationApr.,2016Vol.36No.4
,如果只要样例被正确划分为垃圾评论,而不必考虑具体是欺骗型、干扰性还是低效用性垃圾评论,则本文试验结果在查准率、查全率、综合F值、总准确率上均远高于SVM模型。表4不同模型预测精度对比模型垃圾评论查准率(%)查全率(%)综合值F(%)评论总准确率(%)Logistic回归二分类80.663.270.871.2SVM二分类79.874.076.877.2本文模型四分类80.776.078.380.5本文模型二分类85.080.082.482.6为了进一步验证本文方法的稳定性,对以上数据采用4次交叉法重新实验,4次实验结果的各性能指标如图2~4所示:图24次实验的查准率指标因为训练集的子例是随机选取,使各个类型的子例在训练集中所占的比例不同,数据的结构会有所变化,但每组实验的识别精度大致相同,,说明方法的稳定性较好。从筛选后用于建立决策树的属性来看,也存在比较稳定的趋势,具体情况如表5所示。—60—2016年4月第36卷第4期网络交易垃圾评论智能识别研究Apr.,2016Vol.36No.4
【相似文献】
中国期刊全文数据库 前9条
1 袁阿勇;盛步云;;新型分类装置的智能识别与控制[J];物流技术;2006年11期
2 ;智能识别开启商业新时代[J];现代商业;2014年19期
3 张正华;武邦涛;;危险化学品禁忌智能识别和决策支持系统研究[J];上海管理科学;2009年01期
4 彭婵;;梦想改变生活 挑战识别银晨——访上海银晨智能识别科技有限公司董事长张青[J];中国公共安全(综合版);2006年12期
5 张青;;智能识别市场现状及未来几年发展趋势[J];中国安防;2007年Z1期
6 韩金辉;;安全还是管理? 浅析一卡通产品市场与技术[J];中国安防;2007年07期
7 苏晨;;智能识别市场的现状及发展趋势[J];中国防伪报道;2007年12期
8 卢全进;;绞车智能识别系统在炉峪口矿的应用[J];中国高新技术企业;2013年33期
9 ;[J];;年期
中国重要会议论文全文数据库 前3条
1 杜松怀;刘志存;王忠义;施正香;;基于红外通信的动物身份智能识别装置[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
2 唐盛;鹿昌义;梁艳川;;微生物智能识别方法的研究与实现[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
3 温利东;;以太网技术发展趋势[A];2003年内蒙古自治区自然科学学术年会优秀论文集[C];2003年
中国重要报纸全文数据库 前10条
1 ;近场通信实现畜牧业智能识别[N];人民邮电;2008年
2 郑金武;中科院与香港科大共建智能识别实验室[N];江苏科技报;2009年
3 陈文 吴南强;华雨科技人脸智能识别系统进军世博[N];宜兴日报;2010年
4 本报记者蔡云锦;汉字智能识别产业渐成气候[N];中国经营报;2002年
5 《网络世界》记者 高杨;智能识别开启音乐应用新模式[N];网络世界;2013年
6 记者 沐滟;智能识别企业抱团拼抢市场[N];无锡日报;2012年
7 袁华;网络时代呼唤智能识别[N];中国贸易报;2000年
8 记者 乔佳妮 母家亮;西安出租车有了电子“身份证”[N];陕西日报;2010年
9 齐泽萍;今后,不停车即可进行运政稽查[N];山西经济日报;2008年
10 肖春飞 潘旭;大中小学生角逐“机器人”大赛[N];大众科技报;2009年
中国博士学位论文全文数据库 前1条
1 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 凌云峰;基于安控平台的智能识别与报警[D];苏州大学;2009年
2 洪炎峰;实时海洋浮游生物目标智能识别系统设计[D];浙江大学;2012年
3 张翔;基于神经网络的结构损伤远程智能识别方法研究[D];武汉理工大学;2004年
4 张知临;工商网上违法广告智能识别关键技术研究与实现[D];浙江大学;2013年
5 骆晓娟;市容违章行为智能识别系统设计[D];浙江大学;2014年
6 吴成勇;基于模糊技术的智能识别及其应用研究[D];江南大学;2011年
7 丁方;心电畸异波智能识别方法的研究[D];华东理工大学;2012年
8 李翔基;基于本体的虚拟零件智能识别方法研究与应用[D];北京邮电大学;2009年
9 史中辉;玉米种子品种智能识别系统研究[D];山东农业大学;2011年
10 王强;基于小波和希尔伯特—黄变换的气液两相流流型智能识别方法[D];东北电力大学;2007年
本文编号:2567124
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/2567124.html