当前位置:主页 > 经济论文 > 宏观经济论文 >

网络交易垃圾评论智能识别研究

发布时间:2019-11-28 18:51
【摘要】:定义垃圾评论边界,利用智能算法有效识别垃圾评论。对垃圾评论进行内部细分,构建评价指标体系,并提出一种改良决策树方法对垃圾评论进行智能评估,并提供可读性规则。基于Matlab语言实现,通过实证研究,验证所构建的垃圾评论识别模型能够达到较高预测精度。提供了一种高效的多在线评论多分类智能识别方法,为垃圾评论的分类监管治理提供技术支持。
【图文】:

流程图,垃圾,流程图


建立正规增益为属性选择标准的决策树NG(A,S)=∑4t=1-pilog2pi-∑j∈value(A)SjS∑4t=1-pilog2pilog2n(2)其中pi是属于类别t的样本占总样本数的比例。Value(A)为特征A的取值集合。S和Sj分别为样本总数以及特征A取值为j的样本个数。3.3垃圾评论识别流程本文首先采用中科院计算技术研究所的ICTCLAS工具,并通过加入HowNet情感词典和自定义词典对评论语料进行分词和词性标注等预处理,再运用神经网络与决策树相结合的模型对数据进行分类。具体流程如图1所示:图1垃圾评论识别流程图—59—2016年4月第36卷第4期现代情报JournalofModernInformationApr.,2016Vol.36No.4

查准率,训练集,随机选取,指标


,如果只要样例被正确划分为垃圾评论,而不必考虑具体是欺骗型、干扰性还是低效用性垃圾评论,则本文试验结果在查准率、查全率、综合F值、总准确率上均远高于SVM模型。表4不同模型预测精度对比模型垃圾评论查准率(%)查全率(%)综合值F(%)评论总准确率(%)Logistic回归二分类80.663.270.871.2SVM二分类79.874.076.877.2本文模型四分类80.776.078.380.5本文模型二分类85.080.082.482.6为了进一步验证本文方法的稳定性,对以上数据采用4次交叉法重新实验,4次实验结果的各性能指标如图2~4所示:图24次实验的查准率指标因为训练集的子例是随机选取,使各个类型的子例在训练集中所占的比例不同,数据的结构会有所变化,但每组实验的识别精度大致相同,,说明方法的稳定性较好。从筛选后用于建立决策树的属性来看,也存在比较稳定的趋势,具体情况如表5所示。—60—2016年4月第36卷第4期网络交易垃圾评论智能识别研究Apr.,2016Vol.36No.4

【相似文献】

中国期刊全文数据库 前9条

1 袁阿勇;盛步云;;新型分类装置的智能识别与控制[J];物流技术;2006年11期

2 ;智能识别开启商业新时代[J];现代商业;2014年19期

3 张正华;武邦涛;;危险化学品禁忌智能识别和决策支持系统研究[J];上海管理科学;2009年01期

4 彭婵;;梦想改变生活 挑战识别银晨——访上海银晨智能识别科技有限公司董事长张青[J];中国公共安全(综合版);2006年12期

5 张青;;智能识别市场现状及未来几年发展趋势[J];中国安防;2007年Z1期

6 韩金辉;;安全还是管理? 浅析一卡通产品市场与技术[J];中国安防;2007年07期

7 苏晨;;智能识别市场的现状及发展趋势[J];中国防伪报道;2007年12期

8 卢全进;;绞车智能识别系统在炉峪口矿的应用[J];中国高新技术企业;2013年33期

9 ;[J];;年期

中国重要会议论文全文数据库 前3条

1 杜松怀;刘志存;王忠义;施正香;;基于红外通信的动物身份智能识别装置[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年

2 唐盛;鹿昌义;梁艳川;;微生物智能识别方法的研究与实现[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年

3 温利东;;以太网技术发展趋势[A];2003年内蒙古自治区自然科学学术年会优秀论文集[C];2003年

中国重要报纸全文数据库 前10条

1 ;近场通信实现畜牧业智能识别[N];人民邮电;2008年

2 郑金武;中科院与香港科大共建智能识别实验室[N];江苏科技报;2009年

3 陈文 吴南强;华雨科技人脸智能识别系统进军世博[N];宜兴日报;2010年

4 本报记者蔡云锦;汉字智能识别产业渐成气候[N];中国经营报;2002年

5 《网络世界》记者 高杨;智能识别开启音乐应用新模式[N];网络世界;2013年

6 记者 沐滟;智能识别企业抱团拼抢市场[N];无锡日报;2012年

7 袁华;网络时代呼唤智能识别[N];中国贸易报;2000年

8 记者 乔佳妮 母家亮;西安出租车有了电子“身份证”[N];陕西日报;2010年

9 齐泽萍;今后,不停车即可进行运政稽查[N];山西经济日报;2008年

10 肖春飞 潘旭;大中小学生角逐“机器人”大赛[N];大众科技报;2009年

中国博士学位论文全文数据库 前1条

1 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年

中国硕士学位论文全文数据库 前10条

1 凌云峰;基于安控平台的智能识别与报警[D];苏州大学;2009年

2 洪炎峰;实时海洋浮游生物目标智能识别系统设计[D];浙江大学;2012年

3 张翔;基于神经网络的结构损伤远程智能识别方法研究[D];武汉理工大学;2004年

4 张知临;工商网上违法广告智能识别关键技术研究与实现[D];浙江大学;2013年

5 骆晓娟;市容违章行为智能识别系统设计[D];浙江大学;2014年

6 吴成勇;基于模糊技术的智能识别及其应用研究[D];江南大学;2011年

7 丁方;心电畸异波智能识别方法的研究[D];华东理工大学;2012年

8 李翔基;基于本体的虚拟零件智能识别方法研究与应用[D];北京邮电大学;2009年

9 史中辉;玉米种子品种智能识别系统研究[D];山东农业大学;2011年

10 王强;基于小波和希尔伯特—黄变换的气液两相流流型智能识别方法[D];东北电力大学;2007年



本文编号:2567124

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/2567124.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8110e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com