基于Spark的大规模RNNLM系统

发布时间：2017-04-20 18:24

本文关键词：基于Spark的大规模RNNLM系统，由笔耕文化传播整理发布。

【摘要】：自然语言处理作为人工智能中的重要问题,一直是研究与开发的热点;其中基于递归神经网络的语言模型(RNNLM)具有非常强大的功能和鲁棒性,但由于传统计算技术和计算系统的限制,难以构建大规模的RNNLM系统,制约了RNNLM的准确性等。本文在分析现有串行和基于GPU的RNNLM系统的基础上,针对影响RNNLM中计算量的因素,在Spark平台上,设计了面向大规模RNNLM的结构。改变了通过提高矩阵计算速度提高RNNLM系统性能的方式,模拟生物神经网络的并行特性,设计了基于并行神经元的RNNLM,以逻辑神经元为单位,实现RNNLM的分布式并发,从而将庞大的矩阵运算转变为分布式逻辑神经元的一阶运算,极大的提高了RNNLM的效率,为构建大规模RNNLM奠定了基础。经过测试,利用Spark计算框架优化RNNLM系统,将N x M的矩阵拆分到各个节点中计算,每个神经元只需要计算某一行数据,将庞大的计算量迁移到计算节点中这会大大降低时间开销,系统计算速率提升将近20倍,将语料扩大之后仍然适用。接着分析了分布式平台Spark和RNNLM中制约计算性能的因素,设计了基于参数合并的广播式传输策略、基于NVM的容错机制和面向分布式RNNLM的内存优化机制,从提高分布式RNNLM中参数通信效率和针对RNNLM提高Spark性能两方面进行了改进,系统计算速率提升7-15倍。最后在Spark平台上,实现了大规模分布式RNNLM的原型系统,分别使用微软语料和RNNLM Toolkit语料,对传统的RNNLM系统和基于Spark的RNNLM系统进行了性能测试,测试结果表明基于Spark的RNNLM系统经过结构的优化后,打破了神经元个数方面和大规模语料方面的瓶颈,经过测试,基于Spark的大规模RNNLM原型系统性能比传统的RNNLM系统计算速率提升10倍以上,并没有因为语料成倍扩大导致系统运行时间呈线性成倍上升,极大的提升了RNNLM系统的可用性。
【关键词】：递归神经网络 自然语言处理 分布式计算 Spark
【学位授予单位】：江苏大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TP183;TP391.1
【目录】：

摘要4-6
Abstract6-11
第一章绪论11-24
1.1 研究背景及意义11-22
1.1.1 基于神经网络语言模型的相关研究12-17
1.1.2 分布式计算框架的相关研究17-22
1.2 本文的主要工作和组织结构22-24
1.2.1 本文的主要工作22-23
1.2.2 本文的组织结构23-24
第二章面向大规模RNNLM的结构分析24-34
2.1 现有RNNLM算法的分析24-27
2.2 基于Spark大规模RNNLM的相关定义27-28
2.3 基于Spark大规模RNNLM的结构28-32
2.4 本章小结32-34
第三章基于并行神经元的RNNLM34-43
3.1 分布式神经元自主训练策略34-36
3.1.1 单个神经元ac值的计算34-35
3.1.2 单个神经元与输出层之间权重的更新35
3.1.3 单个神经元与上次隐藏层之间权重的更新35-36
3.1.4 单个神经元与输入层之间权重的更新36
3.2 神经元的协调策略36-38
3.3 原型系统测试与分析38-42
3.3.1 原型系统与测试环境38-39
3.3.2 使用大规模语料的测试与分析39-40
3.3.3 使用小规模语料的测试与分析40-41
3.3.4 非对称Spark集群中的测试与分析41-42
3.4 本章小结42-43
第四章大规模分布式RNNLM的性能优化43-59
4.1 制约大规模分布式RNNLM性能的因素43-45
4.2 面向分布式神经元的高效传输机制45-53
4.2.1 数据共享方式45-46
4.2.2 基于远程直接数据存取的传输策略46-51
4.2.3 基于参数合并的广播式传输策略51-53
4.3 基于NVM的容错机制53-54
4.4 面向分布式RNNLM的内存优化54-55
4.5 原型系统测试与分析55-58
4.5.1 原型系统与测试环境55-56
4.5.2 使用大规模RNNLM Toolkit语料的测试与分析56-57
4.5.3 优化前后的测试与分析57-58
4.6 本章小结58-59
第五章原型系统的测试与分析59-65
5.1 基于Spark的大规模RNNLM原型系统的实现59-61
5.1.1 数据分布模块59
5.1.2 数据收集模块59
5.1.3 汇聚计算模块59-60
5.1.4 分布计算模块60
5.1.5 权重更新模块60
5.1.6 容错机制优化模块60
5.1.7 内存优化模块60-61
5.1.8 基于数据聚合的通信模块61
5.2 原型系统的测试与分析61-64
5.2.1 改变神经元数量的测试与分析62
5.2.2 改变语料规模的测试与分析62-64
5.3 本章小结64-65
第六章总结65-67
6.1 工作总结65-66
6.2 工作展望66-67
参考文献67-71
致谢71-72
在学期间发表的学术论文及其他科研成果72

【相似文献】

中国期刊全文数据库前10条

1 金仁贵;;带有偏差单元的递归神经网络在故障诊断方面的应用[J];电脑知识与技术;2006年29期

2 陈钢;王占山;;连续时间递归神经网络的稳定性分析[J];沈阳理工大学学报;2007年02期

3 汪晓梦;;带有偏差单元的递归神经网络在故障诊断方面的应用优化[J];甘肃联合大学学报(自然科学版);2010年05期

4 杜艳可;徐瑞;;具有时滞的递归神经网络动力学研究进展[J];北华大学学报(自然科学版);2012年01期

5 蒋洪睿,莫玮,李丽;递归神经网络自适应均衡抗突发干扰研究[J];电讯技术;2000年01期

6 宋轶民,余跃庆,张策,马文贵;动态递归神经网络及其在机敏机构辨识中的应用[J];机械科学与技术;2001年04期

7 张奇志,贾永乐,周雅莉;噪声有源控制的递归神经网络方法[J];控制与决策;2001年03期

8 李峰,李树荣;基于动态递归神经网络的动态矩阵控制[J];石油大学学报(自然科学版);2001年03期

9 唐普英,李绍荣,黄顺吉;一种新的复值递归神经网络训练方法及其应用[J];信号处理;2001年06期

10 文敦伟,蔡自兴;递归神经网络的模糊随机学习算法[J];高技术通讯;2002年01期

中国重要会议论文全文数据库前10条

1 房毅宪;王宝文;王永茂;;基于偏差递归神经网络的股价预测(英文)[A];计算机技术与应用进展——全国第17届计算机科学与技术应用（CACIS）学术会议论文集（上册）[C];2006年

2 刘勇;沈毅;胡恒章;;递归神经网络自适应滤波器[A];1998年中国智能自动化学术会议论文集（上册）[C];1998年

3 赵英凯;蔡宁;;基于对角递归神经网络的肟化投酮量在线预估[A];1998年中国智能自动化学术会议论文集（上册）[C];1998年

4 李树荣;李峰;;基于动态递归神经网络的非线性系统重构[A];1998年中国控制会议论文集[C];1998年

5 史志伟;韩敏;;应用递归神经网络建立非线性结构系统模型[A];第二十三届中国控制会议论文集（下册）[C];2004年

6 丛爽;戴谊;;递归神经网络逼近性能的研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年

7 吕进;郭晨;刘雨;;基于不完全递归神经网络的二阶导数多步预测模糊控制及应用[A];2007年中国智能自动化会议论文集[C];2007年

8 蒲兴成;;时变时滞不确定递归神经网络渐近稳定的一个充分条件[A];2008’“先进集成技术”院士论坛暨第二届仪表、自动化与先进集成技术大会论文集[C];2008年

9 仉宝玉;吴志敏;;基于对角递归神经网络的智能PID控制[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年

10 沈艳;谢美萍;;基于递归神经网络的船舶运动极短期建模预报[A];第二届全国信息获取与处理学术会议论文集[C];2004年

中国博士学位论文全文数据库前10条

1 赵永昌;一类时滞静态递归神经网络的动力学行为研究[D];中国海洋大学;2010年

2 高海宾;扰动作用下递归神经网络稳定性研究[D];燕山大学;2006年

3 黄玉娇;具有广义分段线性激活函数的递归神经网络的多稳定性分析[D];东北大学;2014年

4 徐东坡;递归神经网络梯度学习算法的收敛性[D];大连理工大学;2009年

5 于佳丽;递归神经网络的连续吸引子与模糊控制[D];电子科技大学;2009年

6 王芬;递归神经网络的动力学行为分析[D];武汉科技大学;2011年

7 季策;时滞递归神经网络的动态特性研究[D];东北大学;2005年

8 徐军;递归神经网络稳定性分析[D];浙江大学;2007年

9 张锐;几类递归神经网络的稳定性及其应用研究[D];东北大学;2010年

10 张益军;时滞递归神经网络稳定性分析及网络化同步控制[D];东华大学;2008年

中国硕士学位论文全文数据库前10条

1 柳玉华;一种递归神经网络方法研究及其在非线性系统跟踪控制中的应用[D];江西理工大学;2015年

2 罗威威;全局指数稳定的递归神经网络的鲁棒性分析[D];中国矿业大学;2015年

3 杨渺渺;具有时滞的递归神经网络稳定性分析[D];电子科技大学;2015年

4 崔志超;基于产品特征的中文评论情感分析系统设计与实现[D];河北科技大学;2015年

5 余仕敏;基于递归神经网络的广告点击率预估[D];浙江理工大学;2016年

6 宛立达;基于振动信号分析的故障诊断理论与应用[D];东北石油大学;2010年

7 李克强;基于Spark的大规模RNNLM系统[D];江苏大学;2016年

8 葛洋;多时滞递归神经网络的指数稳定性研究[D];曲阜师范大学;2010年

9 张欣;递归神经网络的研究及在非线性动态系统辨识中的应用[D];太原理工大学;2005年

10 曾智;递归神经网络的动力学行为研究[D];重庆大学;2006年

本文关键词：基于Spark的大规模RNNLM系统，，由笔耕文化传播整理发布。

本文编号：319297

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/319297.html

上一篇：激光传感器三维靶标检测系统的设计与研究
下一篇：SCARA机器人的结构设计与运动控制算法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|