当前位置:主页 > 科技论文 > 软件论文 >

基于混合深度信念网络的多类文本表示与分类方法

发布时间:2017-09-24 18:22

  本文关键词:基于混合深度信念网络的多类文本表示与分类方法


  更多相关文章: 文本分类 文本表示 深度学习 深度信念网络


【摘要】:本文开展了基于混合深度信念网络的多类文本表示与分类方法的研究,以解决传统的Bag-ofWords(BOW)表示方法忽略文本语义信息、特征提取存在高维度高稀疏的问题。文章基于文本关键字,针对多类的分类任务(如新闻文本和生物医学文本),以关键字的词向量表示作为文本输入,同时结合深度信念网络(Deep Belief Network,DBN)和深度玻尔兹曼机网络(Deep Boltzmann Machine,DBM),设计了一种混合深度信念网络(Hybrid Deep Belief Network,HDBN)模型。文本分类和文本检索的实验结果表明,基于词向量嵌入的深度学习模型在性能上优于传统方法。此外,通过二维空间可视化实验,由HDBN模型提取的高层文本表示具有高内聚低耦合的特点。
【作者单位】: 北京科技大学计算机科学与技术系;中国矿业大学计算机科学与技术系;
【关键词】文本分类 文本表示 深度学习 深度信念网络
【基金】:国家自然科学基金项目:结合前馈和反馈机制的自然场景文本识别技术(61473036)资助
【分类号】:TP391.1
【正文快照】: 1研究背景更好得挖掘蕴含在文本中的复杂语义关系,与具体任务紧密结合。同时,伴随互联网规模的扩张在“信息过载”时代,如何有效地管理、过和多媒体的发展,大规模训练数据以及机器设备滤和筛选信息成为一项重要的研究课题。在网络性能的重大提升,高性能GPU和CPU集群提供信息中

【相似文献】

中国期刊全文数据库 前10条

1 彭佳;;另一种文本中心——回应尤里·洛特曼的文本观[J];符号与传媒;2011年02期

2 王霞;;巧将文本数值变为数字[J];科学24小时;2006年09期

3 孙艳妙;CSS样式在Flash MX 2004中的应用[J];中小学电教;2005年08期

4 尤里·M·洛特曼;彭佳;;文本运动过程——从作者到读者,从作者到文本[J];符号与传媒;2011年02期

5 薛笛;;打造多彩的文本[J];程序员;2006年03期

6 刘全升;姚天f ;黄高辉;刘军;宋鸿彦;;汉语意见型主观性文本类型体系的研究[J];中文信息学报;2008年06期

7 陈立强;;论电视频道自文本导读系统及其功能[J];新闻知识;2008年02期

8 许延祥;罗铁坚;周佳;王竹;;评价文本中意见分布规律研究[J];中文信息学报;2014年03期

9 牛可刚;;在物理课件中让文本滚动起来[J];实验教学与仪器;2005年04期

10 陈立强;张宜迁;;电视导读的多媒介联动现象及其意义[J];中国广播电视学刊;2008年08期

中国重要会议论文全文数据库 前4条

1 张智军;沈f ;朱伟;;文本组织方式对介绍性文章搜索绩效的影响研究[A];中国人类工效学学会第六次学术交流会论文摘要汇编[C];2003年

2 岳福新;白玫;;浅析英语旅游信息文本的写作与翻译[A];译学辞典与翻译研究——第四届全国翻译学辞典与翻译理论研讨会论文集[C];2007年

3 刘全升;姚天f ;黄高辉;刘军;宋鸿彦;;汉语意见型主观性文本类型体系的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

4 程世和;;“《诗》亡然后《春秋》作”——对一个文学缺失时代的文学反题之研究[A];东方丛刊(2004年第4辑 总第五十辑)[C];2004年

中国重要报纸全文数据库 前8条

1 李承贵;学术视域中的文本[N];社会科学报;2001年

2 山东 王霞;巧将文本数值变数字[N];电子报;2006年

3 江苏 许向前;在课件中让文本滚动起来[N];电脑报;2004年

4 辽宁 鸣涧;为光盘制作漂亮的封套[N];电脑报;2002年

5 ;制作CD封套[N];电脑报;2002年

6 广东 Pcking;FlashMX 2004新功能实战[N];电脑报;2003年

7 王先明 李尹蒂;关于义和团各种记忆文本类型比较[N];团结报;2010年

8 编译 李茂;美国统一课程标准定稿[N];中国教师报;2010年

中国博士学位论文全文数据库 前8条

1 闫琰;基于深度学习的文本表示与分类方法研究[D];北京科技大学;2016年

2 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年

3 陈洁倩;阅读理解的文本类型和答题形式对外语水平的效力[D];上海外国语大学;2006年

4 刘桂兰;论重译的世俗化取向[D];上海外国语大学;2011年

5 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年

6 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年

7 孟朋;自然语言信息隐藏与检测研究[D];中国科学技术大学;2012年

8 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年

中国硕士学位论文全文数据库 前10条

1 王爱;《与鲁本·伍尔夫一起战斗》翻译实践报告[D];内蒙古大学;2015年

2 张晓叶;文本类型视角下《2011年经济合作与发展组织对医疗系统的审核:瑞士》的翻译报告[D];华南理工大学;2015年

3 钟超玮;基于区间的文本相似搜索及其在档案清洗中的应用[D];南京大学;2015年

4 张新宇;目的论视角下经济类文本的汉译[D];兰州大学;2015年

5 拓华;等效论指导下生态批评文本的翻译探索[D];兰州大学;2015年

6 薄璐璐;经济史文本汉译技巧研究[D];兰州大学;2015年

7 姚南;从目的论视角看说明书的英汉翻译[D];华中师范大学;2015年

8 赵琴;文本类型理论视角下中国国防白皮书的英译[D];华中师范大学;2015年

9 张琴;文本类型理论视角下的科技论文摘要英译[D];南京理工大学;2015年

10 李丹卉;《当今的生活规划—德国年轻人想要如何生活》节译报告[D];四川外国语大学;2015年



本文编号:912770

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/912770.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7e032***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com