当前位置:主页 > 科技论文 > 软件论文 >

结合语义扩展和卷积神经网络的中文短文本分类方法

发布时间:2018-12-25 17:06
【摘要】:中文新闻标题通常包含一个或几十个词,由于字符数少、特征稀疏,在分类问题中难以提升正确率。为解决此问题,提出了基于Word Embedding的文本语义扩展方法。首先,将新闻标题扩展为(标题、副标题、主题词)构成的三元组,用标题的同义词结合词性过滤方法构造副标题,对多尺度滑动窗口内的词进行语义组合,提取主题词;然后,针对扩展文本构造卷积神经网络(CNN)分类模型,该模型通过max pooling及随机dropout进行特征过滤及防止过拟合;最后,将标题、副标题拼接为双词表示,与多主题词集分别作为模型的输入。在2017自然语言处理与中文计算评测(NLPCC2017)的新闻标题分类数据集上进行实验。实验结果表明,用三元组扩展结合相应的CNN模型在18个类别新闻标题上分类的正确率为79.42%,比未经扩展的CNN模型提高了9.5%,且主题词扩展加快了模型的收敛速度,验证了三元组扩展方法及所构建CNN分类模型的有效性。
[Abstract]:Chinese news headlines usually contain one or dozens of words. Because of the small number of characters and sparse features, it is difficult to improve the accuracy in classification problems. To solve this problem, a text semantic extension method based on Word Embedding is proposed. Firstly, the news title is extended to a triple (title, subtitle, subject word). The subtitle is constructed by the synonym of the title combined with the method of part of speech filtering, and the words in the multi-scale sliding window are semantically combined to extract the subject word. Then, the (CNN) classification model of convolution neural network is constructed for extended text. The model uses max pooling and random dropout to filter features and prevent over-fitting. Finally, the title and subtitle are spliced into two-word representation, and the multi-subject word set is used as the input of the model. Experiments were carried out on the 2017 Natural language processing and Chinese Computational Evaluation (NLPCC2017) news headline classification data set. The experimental results show that the correct rate of classifying with triple extension and corresponding CNN model on 18 categories of news headlines is 79.42, which is 9.5% higher than that of unexpanded CNN model, and the speed of convergence of the model is accelerated by the expansion of subject words. The validity of the triple extension method and the constructed CNN classification model is verified.
【作者单位】: 重庆理工大学计算机科学与工程学院;
【基金】:国家社会科学基金西部项目(17XXW005) 重庆市教委科学技术研究项目(KJ1500903)~~
【分类号】:TP183;TP391.1

【相似文献】

相关期刊论文 前10条

1 万静;王文聪;易军凯;;一种基于本体的知识库语义扩展搜索方法[J];计算机工程;2012年06期

2 旷章辉;王甲海;周雅兰;;用改进的竞争Hopfield神经网络求解多边形近似问题[J];计算机科学;2009年03期

3 高永建 ,吴健康;神经网络及其识别应用简介[J];电信科学;1990年02期

4 谢国梁;;神经网络:从希望到现实[J];激光与光电子学进展;1991年01期

5 郑士贵;文献自动阅读神经网络[J];管理科学文摘;1996年08期

6 吕芬;赵生妹;;基于Hopfield神经网络的噪声字母识别[J];计算机与信息技术;2005年12期

7 李毅;童红俊;宋贵宝;李冬;;神经网络在飞行器航迹仿真计算中的应用[J];海军航空工程学院学报;2006年05期

8 林钢;;基于SOM神经网络对潜在客户的挖掘[J];南宁职业技术学院学报;2006年04期

9 杨帆;陈劲杰;唐梅华;陈鑫;;简论神经网络在搜索中的应用[J];机械管理开发;2008年01期

10 朱红斌;;LVQ神经网络在交通事件检测中的应用[J];计算机工程与应用;2008年34期

相关会议论文 前10条

1 陈文新;王长富;戴蓓倩;;基于神经网络的汉语四声识别[A];第一届全国语言识别学术报告与展示会论文集[C];1990年

2 李睿;李明军;;一种模糊高斯基神经网络在数值逼近上的仿真[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

3 许旭萍;臧道青;;采用Hopfield神经网络实施缸盖表面点阵字符识别[A];第十五届全国汽车检测技术年会论文集[C];2011年

4 朱长春;;神经网络用于线性时固有系统的广义状态转移矩阵的识别[A];中国工程物理研究院科技年报(1999)[C];1999年

5 王玉斌;李永明;王颖;;用数据挖掘和神经网络技术预测工程造价[A];第十一届全国电工数学学术年会论文集[C];2007年

6 应捷;袁一方;;神经网络指纹特征点匹配算法的改进[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年

7 谢小良;符卓;;基于Hopfield神经网络的单周期船舶调度模型及算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年

8 陈意;;神经网络在船舶识别一个应用[A];船舶航泊安全的新经验新技术论文集(上册)[C];2007年

9 王辉;杨杰;黎明;蔡念;;一种基于神经网络的图像复原方法[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年

10 贾睿;徐启强;刘艳;;基于神经网络的网壳结构近似分析研究[A];第二十一届全国振动与噪声高技术及应用学术会议论文集[C];2008年

相关重要报纸文章 前1条

1 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

相关博士学位论文 前10条

1 李晓刚;基于神经网络的码垛机器人视觉位姿测量及伺服控制研究[D];北京林业大学;2015年

2 户保田;基于深度神经网络的文本表示及其应用[D];哈尔滨工业大学;2016年

3 沈旭;基于序列深度学习的视频分析:建模表达与应用[D];中国科学技术大学;2017年

4 诸勇;正交回归神经网络及其在控制系统中的应用[D];浙江大学;1998年

5 李彦冬;基于卷积神经网络的计算机视觉关键技术研究[D];电子科技大学;2017年

6 包姣;基于深度神经网络的回归模型及其应用研究[D];电子科技大学;2017年

7 田景文;地下油藏的仿真与预测[D];哈尔滨工程大学;2001年

8 彭宏京;基于稀疏RAM的神经网络及其人脸识别应用研究[D];南京航空航天大学;2002年

9 王吉权;BP神经网络的理论及其在农业机械化中的应用研究[D];沈阳农业大学;2011年

10 王鑫;基于表示学习的情感分析关键技术研究[D];哈尔滨工业大学;2017年

相关硕士学位论文 前10条

1 沈连花;英语“go”与朝鲜语“kada”的语义扩展对比分析[D];延边大学;2016年

2 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

3 蔡邦宇;人脸识别中单次ERP时空特征分析及其快速检索的应用[D];浙江大学;2015年

4 郑川;垃圾评论检测算法的研究[D];西南交通大学;2015年

5 汪济民;基于卷积神经网络的人脸检测和性别识别研究[D];南京理工大学;2015年

6 彭玲玲;基于不确定理论与机器学习的行人检测[D];长安大学;2015年

7 杨陈东;BP-Fisher判别分析法[D];长安大学;2015年

8 孟鑫;基于Hadoop云平台下的客流量预测研究[D];长安大学;2015年

9 张勇;深度卷积神经网络在车牌和人脸检测领域的应用研究[D];郑州大学;2015年

10 宋璐璐;财经职业技术学院票务管理系统的设计与实现[D];西安工业大学;2015年



本文编号:2391402

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2391402.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c310d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com