基于机器学习的车辆网络资源分配策略研究
发布时间:2021-07-08 08:44
随着通信网络的高速发展,未来的网络将会成为一个自治系统,海量数据与智能算法一定会成为无线网络进一步发展的重要基础。在智能交通方面,随着人们对车辆智能化需求的不断增加,车辆网络亟待研究与发展。在车辆网络中,各类车辆服务对缓解交通压力和减少交通事故有着重要意义。然而,车辆网络资源有限,随着车辆服务需求的增加,合理分配车辆网络中的资源,对保障车辆服务的高可靠低时延需求具有重要意义。首先,介绍了车辆网络的研究现状,并介绍了机器学习在车辆网络中的研究现状,对车辆网络中的资源分配策略进行了重点描述,发现了机器学习方法的可适用性,认为使用机器学习方法来进行车辆网络的资源分配是一项有意义的研究。然后,提出一个三层车辆网络架构,包括本地计算层、移动边缘计算层和云计算层。在此架构的基础上,考虑到车辆网络的低时延要求,将完成任务的时延作为系统成本提出了目标函数;针对这个目标函数,为系统制定了相关状态、动作及奖励,提出基于强化学习的资源分配算法,实现了层与层之间高效的动态计算资源分配。仿真结果表明,所提策略可以使系统总成本最小化,使得服务任务满足其低时延需求。进一步,在上述工作的基础上,提出以机器学习算法为基...
【文章来源】:重庆邮电大学重庆市
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
V2X通信常用场景模式
重庆邮电大学硕士学位论文第2章基于机器学习的资源分配策略概述9人小娜和特斯拉智能车辆正在改变着人们的生活。为了能更好地利用机器学习这一强有力的工具,接下来本章深入学习并研究了机器学习的基础知识和基本原理。2.1.1机器学习分类根据需要解决的问题及数据种类的不同,对一个问题的建模有不同的方式。在机器学习领域,有不同的学习方式用以解决不同的问题,学习方式一般可分为监督学习、无监督学习、半监督学习和强化学习等四种。1.监督学习监督学习通常分为“回归”和“分类”两大问题。在学习过程中,每个数据都会获得其对应的标签,如类别标签或与数值相关的标签。对这些带有标签的数据进行分析和处理,可以得到预测模型。进一步可以通过调整预测模型的参数,以提高预测的准确率。在得到一个准确率稳定的预测模型之后,可以通过这个预测模型对无标注数据进行预测,得到结果。在回归问题中,一个连续值将会被预测。也就是说回归问题的目的是计算出一个连续的函数将输入变量和输出结果对应起来;而在分类问题中,一个离散值将会被预测,试图将输入变量与离散的类别对应起来[23]。图2.1为监督学习的一般过程。图2.1监督学习2.无监督学习与监督学习不同,在无监督学习中,输入数据是没有标签的,输出结果同样也没有明确的标签。因为样本数据类别未知,所以需要根据样本间的相似性对输入数据集进行分类,使同一类的数据间的差距最小化,不同类的数据间差距最大化。主要方法是基于输入数据的相似性进行聚类,其原理是发现并规定出不同类的核或初始内核,然后依据数据与核之间的相似性度量将输入数据聚集成不同的类别[23]。图2.2为无监督学习的一般过程。
重庆邮电大学硕士学位论文第2章基于机器学习的资源分配策略概述10图2.2无监督学习3.半监督学习在此学习方式下,输入数据部分被标记,部分没有被标记,故为监督学习和无监督学习的结合[23]。图2.3为半无监督学习的一般过程。在很多实际问题中,因为只有少量数据的带有标签,所以对所有数据进行标记的代价有时很高。为了实现半监督分类,增强分类效果,通常在有监督的分类算法中加入无标签的样本数据来实现半监督学习。图2.3半监督学习4.强化学习强化学习是一种学习模型,通常通过某种激励机制,给予正确行为奖励,惩罚错误行为,不断进行训练,以达到最优的行为集合。图2.4为强化学习的一般过程。强化学习的主体是一个智能体。在强化学习中不需要有标签的数据,而是由数据生成环境。在这一环境中的不同状态下的智能体可以做出不同的动作,每个动作都有规定的奖励或惩罚。其目的是在进行不断的循环学习后,智能体可以在这个环境中所作的每一个动作都能获得其最大奖励[24]。由最佳动作组成的集合即为最优的行为集合,也是进行强化学习之后得到的最终结果。图2.4强化学习
【参考文献】:
期刊论文
[1]Engineering[J]. Engineering. 2020(05)
[2]移动边缘计算在车联网中的应用[J]. 李佐昭,刘金旭. 现代电信科技. 2017(03)
[3]边缘计算:万物互联时代新型计算模型[J]. 施巍松,孙辉,曹杰,张权,刘伟. 计算机研究与发展. 2017(05)
[4]全球车联网发展态势研究[J]. 曹磊. 竞争情报. 2014(04)
[5]云计算研究进展综述[J]. 张建勋,古志民,郑超. 计算机应用研究. 2010(02)
本文编号:3271244
【文章来源】:重庆邮电大学重庆市
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
V2X通信常用场景模式
重庆邮电大学硕士学位论文第2章基于机器学习的资源分配策略概述9人小娜和特斯拉智能车辆正在改变着人们的生活。为了能更好地利用机器学习这一强有力的工具,接下来本章深入学习并研究了机器学习的基础知识和基本原理。2.1.1机器学习分类根据需要解决的问题及数据种类的不同,对一个问题的建模有不同的方式。在机器学习领域,有不同的学习方式用以解决不同的问题,学习方式一般可分为监督学习、无监督学习、半监督学习和强化学习等四种。1.监督学习监督学习通常分为“回归”和“分类”两大问题。在学习过程中,每个数据都会获得其对应的标签,如类别标签或与数值相关的标签。对这些带有标签的数据进行分析和处理,可以得到预测模型。进一步可以通过调整预测模型的参数,以提高预测的准确率。在得到一个准确率稳定的预测模型之后,可以通过这个预测模型对无标注数据进行预测,得到结果。在回归问题中,一个连续值将会被预测。也就是说回归问题的目的是计算出一个连续的函数将输入变量和输出结果对应起来;而在分类问题中,一个离散值将会被预测,试图将输入变量与离散的类别对应起来[23]。图2.1为监督学习的一般过程。图2.1监督学习2.无监督学习与监督学习不同,在无监督学习中,输入数据是没有标签的,输出结果同样也没有明确的标签。因为样本数据类别未知,所以需要根据样本间的相似性对输入数据集进行分类,使同一类的数据间的差距最小化,不同类的数据间差距最大化。主要方法是基于输入数据的相似性进行聚类,其原理是发现并规定出不同类的核或初始内核,然后依据数据与核之间的相似性度量将输入数据聚集成不同的类别[23]。图2.2为无监督学习的一般过程。
重庆邮电大学硕士学位论文第2章基于机器学习的资源分配策略概述10图2.2无监督学习3.半监督学习在此学习方式下,输入数据部分被标记,部分没有被标记,故为监督学习和无监督学习的结合[23]。图2.3为半无监督学习的一般过程。在很多实际问题中,因为只有少量数据的带有标签,所以对所有数据进行标记的代价有时很高。为了实现半监督分类,增强分类效果,通常在有监督的分类算法中加入无标签的样本数据来实现半监督学习。图2.3半监督学习4.强化学习强化学习是一种学习模型,通常通过某种激励机制,给予正确行为奖励,惩罚错误行为,不断进行训练,以达到最优的行为集合。图2.4为强化学习的一般过程。强化学习的主体是一个智能体。在强化学习中不需要有标签的数据,而是由数据生成环境。在这一环境中的不同状态下的智能体可以做出不同的动作,每个动作都有规定的奖励或惩罚。其目的是在进行不断的循环学习后,智能体可以在这个环境中所作的每一个动作都能获得其最大奖励[24]。由最佳动作组成的集合即为最优的行为集合,也是进行强化学习之后得到的最终结果。图2.4强化学习
【参考文献】:
期刊论文
[1]Engineering[J]. Engineering. 2020(05)
[2]移动边缘计算在车联网中的应用[J]. 李佐昭,刘金旭. 现代电信科技. 2017(03)
[3]边缘计算:万物互联时代新型计算模型[J]. 施巍松,孙辉,曹杰,张权,刘伟. 计算机研究与发展. 2017(05)
[4]全球车联网发展态势研究[J]. 曹磊. 竞争情报. 2014(04)
[5]云计算研究进展综述[J]. 张建勋,古志民,郑超. 计算机应用研究. 2010(02)
本文编号:3271244
本文链接:https://www.wllwen.com/kejilunwen/qiche/3271244.html