基于强化学习的多路径传输控制协议优化
【学位单位】:南京大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP393.06
【部分图文】:
、??图1-1:?MPTCP的协议栈??TCP/IP协议族是一组不同层次上的多个协议的组合,如图1-1左侧所示,??TCP/IP通常被表示为一个四层协议系统,每层负责不同的功能,层与层之间分??工合作[I]。链路层通常包括操作系统中的设备驱动程序和计算机中对应的网??络接口卡,处理物理接口的细节;网络层负责处理分组选路等分组在网络中的??活动;传输层负责为两台主机上的应用程序提供端到端的通信。传输控制协议??TCP属于传输层的协议,可以提供高可靠性的数据通信;应用层负责处理特定??的应用程序细节[1]。??如图1-1右侧所示,MPTCP也属于传输层的协议,可以看作是单路径TCP??扩展到多路径的多路传输协议。MPTCP使得多网卡、多链路的资源得以充分利??用,同时提高传输的效率和鲁棒性。MPTCP使用与单路径TCP?—样的socket??接口,使得能够兼容现有的TCP应用。同时MPTCP的每个子流和单路径TCP??流类似,使用相同的TCP首部数据格式和数据封装过程,这使得MPTCP能够??兼容其下的网络层协议。??图1-2展示了使用MPTCP进行数据传输时
?、、、、?TCP!?TCP2?…TCPn??、??图1-1:?MPTCP的协议栈??TCP/IP协议族是一组不同层次上的多个协议的组合,如图1-1左侧所示,??TCP/IP通常被表示为一个四层协议系统,每层负责不同的功能,层与层之间分??工合作[I]。链路层通常包括操作系统中的设备驱动程序和计算机中对应的网??络接口卡,处理物理接口的细节;网络层负责处理分组选路等分组在网络中的??活动;传输层负责为两台主机上的应用程序提供端到端的通信。传输控制协议??TCP属于传输层的协议,可以提供高可靠性的数据通信;应用层负责处理特定??的应用程序细节[1]。??如图1-1右侧所示,MPTCP也属于传输层的协议,可以看作是单路径TCP??扩展到多路径的多路传输协议。MPTCP使得多网卡、多链路的资源得以充分利??用,同时提高传输的效率和鲁棒性。MPTCP使用与单路径TCP?—样的socket??接口,使得能够兼容现有的TCP应用。同时MPTCP的每个子流和单路径TCP??流类似
图3-3:基于强化学习的MPTCP拥塞控制SmartCC的框架??态映射到离散的状态区域块。所以每个状态s可以由一个状态区域块t?=?iA〇)??表示,该等式表示状态区域块T包含状态s或者状态区域块T被状态s激活。??因此,2函数(动作值函数)可以表示为:2(r,a)?=?2(少⑷,a)=E[2:yV,],??其含义为从状态s出发,执行动作《后,机器能得到的累积折扣奖赏的期望。??本文采用基于表格形式的Q-leaming算法[37],来学出一个贪婪的确定性??策略?7r(a,)?=?argmaxa?2(少(\),^〇。举例,当?A?=?argmaxa?2(0(4),^,那么如果??机器从状态^出发,执行动作并一直根据该策略选择执行动作,机器将??会得到最大化的累积折扣奖赏。训练器的规则表也会根据策略7T添加或更新规??则—个基于贪婪确定性策略的规则表如表3-3所示,它指定了不同状??态下最大化累积折扣奖赏的动作。例如表3-3的第一行规则<Tl5?A?>,第一项??被状态h激活的状态区域块n?=?(Ahi),第二项是基于2函数最大化的动作??ax?=?argmaxa?Q(i//(si),a)〇??
【相似文献】
相关期刊论文 前10条
1 哈渭涛;;一种新的反馈式流媒体拥塞控制算法[J];科学技术与工程;2010年05期
2 韩燮;安爱芬;;一种网络拥塞控制算法的研究[J];太原大学学报;2008年03期
3 王满喜;胡向晖;马刈非;;混合式的网络拥塞控制算法[J];电子科技大学学报;2007年03期
4 常可沛;李绍滋;;一种基于反馈的流媒体拥塞控制算法的改进[J];计算机应用;2007年10期
5 杨新宇,曾明,江晓,赵瑞,吴航;一种新的自适应网络拥塞控制算法[J];计算机工程;2004年08期
6 蒋学勤,杨丽芳;网络中两类拥塞控制算法比较[J];贵州大学学报(自然科学版);2003年04期
7 熊晓将;;基于探测机制的卫星链路拥塞控制算法研究[J];航天器工程;2012年05期
8 党美莹;欧阳;孙元姝;甄长飞;;一种新的流媒体拥塞控制算法[J];小型微型计算机系统;2011年08期
9 彭立宏;张鹤颖;姜新文;窦文华;;一种快速公平收敛的拥塞控制算法[J];电子学报;2010年08期
10 刘宇苹;;基于拥塞控制算法的研究[J];武汉船舶职业技术学院学报;2009年03期
相关博士学位论文 前10条
1 龙承念;高动态异构INTERNET拥塞控制算法研究[D];燕山大学;2004年
2 钱艳平;互联网拥塞控制算法若干问题研究[D];东南大学;2006年
3 杨洪勇;Internet拥塞控制算法的动力学研究[D];东南大学;2005年
4 邵立松;互联网端到端拥塞控制算法研究[D];国防科学技术大学;2006年
5 陈虎;互联网拥塞控制算法研究[D];华中科技大学;2008年
6 胡曦;无线SDN稳定性拥塞控制算法研究[D];电子科技大学;2017年
7 侯萍;基于控制理论的网络拥塞控制算法研究[D];南京理工大学;2011年
8 杨歆豪;基于控制理论的网络拥塞控制中的若干算法研究[D];南京理工大学;2010年
9 任娟;无线Mesh网络的资源分配及拥塞控制算法研究[D];北京交通大学;2010年
10 何凌;TCP/IP网络拥塞控制若干问题的研究[D];东北大学;2008年
相关硕士学位论文 前10条
1 张晗;基于强化学习的多路径传输控制协议优化[D];南京大学;2019年
2 李超君;面向实时音视频流的拥塞控制算法[D];北京邮电大学;2019年
3 吴蕾蕾;数据驱动的移动视频直播拥塞控制技术研究[D];北京邮电大学;2019年
4 李洪林;异构网络中TCP拥塞控制算法的研究与改进[D];北京邮电大学;2019年
5 李少博;端到端的TCP拥塞控制算法研究[D];哈尔滨理工大学;2018年
6 刘盼;基于BBR拥塞控制算法的空间环境数据传输系统[D];中国科学院大学(中国科学院国家空间科学中心);2018年
7 潘俊臣;基于TCP协议的拥塞控制算法的研究[D];成都理工大学;2018年
8 徐磊;基于模糊神经网络的无线网络拥塞控制算法[D];江苏科技大学;2018年
9 汤永锋;基于嵌入式的TCP无线通信设计与性能研究[D];华中科技大学;2017年
10 段家琛;移动环境下MPTCP拥塞控制算法的设计与实现[D];北京邮电大学;2013年
本文编号:2891344
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2891344.html