当前位置:主页 > 经济论文 > 电子商务论文 >

基于神经网络的文本倾向性分类研究

发布时间:2018-01-28 13:01

  本文关键词: 倾向性分类 文本预处理 特征抽取 BP神经网络 出处:《内蒙古大学》2017年硕士论文 论文类型:学位论文


【摘要】:互联网是随着时代发展产生的新型信息交流工具,如今已经进入了我们学习生活中的方方面面。与此同时网络上可交流的平台越来越多,在这些平台中各种各样的评论性文本也呈爆发式增长,对这些文本进行倾向分类,挖掘文本中潜在的价值具有十分重要的意义。各种平台的评论性文本包含着对时事、物品的正负评论等,对此类文本进行倾向性分类主要是以情感、舆论导向为主线进行分类。如今,这项工作越来越被关注同时吸引了大批学者。关于对文本进行倾向性分类主要有两类方法,一是借助于词典、语料库的方法。此方法在文本分类方面具有良好的效果,但是此方法过多依赖词典等外部元素,分类结果的好坏与词典等外部元素有直接关系,同时计算量较大。第二种方法是机器学习方法,该方法结合特征抽取技术,对文本用特殊的方式进行表示进而使用机器学习方法分类。不同的机器学习方法分类效果不同,且容易受到文本好坏的影响。本文以论坛评论性文本和电子商务网站评论性文本为载体,对文本进行倾向性分类。结合不同文本的特点,本文中人工采集了一组含噪声较多的论坛数据同时在网站采集了一组规范的电商评论数据。评论性文本结构复杂、语言风格多样,针对此类现象,首先对文本进行了处理,将文本格式等进行规范化,然后专门构造了分词词典并应用到了分词过程中去。结合文本向量表示方法及X 2统计量特征抽取方法构造了文本的向量矩阵。由于论坛和电商网站评论性文本存在噪声较多且特征多变,结合文本倾向分类的方式,本文选择利用文本预处理结合机器学习进行文本倾向性分类。在众多机器学习方法中,本文选用BP神经网络模型作为文本倾向性分类模型。本文中在文本分类模型训练过程中,构造了一层到两层的神经网络分类模型然后在不同的训练集上进行了比对实验,选出了最优模型进而对测试文本进行了测试实验。通过不同数据集对该模型的实验结果的分析,验证了 BP神经网络分类模型对含有噪声的文本的容错能力,分类效果较好。
[Abstract]:With the development of the times, the Internet is a new information exchange tool, and now it has entered all aspects of our study and life. At the same time, there are more and more communication platforms on the network. In these platforms, a variety of critical text is also explosive growth, these texts tend to classify. It is very important to excavate the potential value in the text. The critical texts of various platforms contain positive and negative comments on current affairs and articles, and the classification of this kind of text is mainly based on emotion. Public opinion is the main line of classification. Nowadays, this work has attracted more and more attention and attracted a large number of scholars. There are two main methods of text classification, one is the use of dictionaries. Corpus method. This method has a good effect in text classification, but this method relies too much on external elements such as dictionaries, and the classification results are directly related to external elements such as dictionaries. The second method is machine learning, which combines feature extraction technology. Text is represented in a special way and then classified by machine learning. Different machine learning methods have different classification effects. And it is easy to be influenced by the text. This paper takes the critical text of forum and the critical text of e-commerce website as the carrier to classify the text tendentiously and combine the characteristics of different texts. In this paper, a group of noisy forum data is collected manually and a set of standard ecommerce review data is collected on the website. The structure of the critical text is complex and the language style is diverse, aiming at this kind of phenomenon. Firstly, the text is processed and the text format is standardized. Then the lexicon of participle is constructed and applied to the process of word segmentation. Combining with the representation of text vector and X. (2) the statistical feature extraction method constructs the vector matrix of the text. Because of the frequent noise and the changeable feature of the critical text in the forum and the e-commerce website. Combined with text tendency classification, this paper chooses text preprocessing combined with machine learning to classify text tendentiousness. In many machine learning methods. In this paper, BP neural network model is selected as the text orientation classification model. In this paper, the text classification model training process. A neural network classification model with one to two layers is constructed and the comparison experiments are carried out on different training sets. The optimal model is selected and the test text is tested. The fault tolerance ability of BP neural network classification model for noisy text is verified by analyzing the experimental results of the model in different data sets. The classification effect is better.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;TP183

【相似文献】

相关期刊论文 前10条

1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期

2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年

10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

相关硕士学位论文 前10条

1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年



本文编号:1470836

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1470836.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5893c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com