当前位置:主页 > 管理论文 > 移动网络论文 >

基于强化学习的安全协议形式化自动验证技术研究

发布时间:2022-02-09 13:16
  近年来,网络安全问题日趋严重,针对计算机网络的安全和隐私研究已刻不容缓。为了解决网络协议安全性不足的问题,研究人员设计了各种网络安全协议(以下简称安全协议),以增强网络的安全。但是,很多投入实际应用的安全协议在运行时并不能提供其声明的安全服务。因此,针对安全协议的安全性检测成为安全测试中的重要环节。研究人员在设计或优化安全协议后,需要进一步证明该协议的安全。与非形式化的安全协议验证技术相比,形式化方法能够更全面、深入的检测安全协议和软件中未知的漏洞,它不仅能够证明安全协议的安全性,而且有助于发现针对安全协议的新型攻击手段。但是由于安全协议的复杂性,现有的形式化验证技术并不能自动化证明所有的安全协议,在证明过程中需要专业验证人员辅助计算机完成证明。过高的人力成本和学习成本阻碍了形式化验证技术的进一步发展和运用。本文围绕安全协议的形式化自动验证相关问题,开展了深入的研究。主要研究成果总结如下:1.提出了一种基于强化学习的安全协议形式化自动验证技术,设计并实现了原型系统。本方法突破并解决了传统形式化自动验证中的状态空间爆炸问题。相比于传统的形式化验证工具,该系统可以全自动地搜索正确证明路径,... 

【文章来源】:中国科学技术大学安徽省211工程院校985工程院校

【文章页数】:117 页

【学位级别】:博士

【部分图文】:

基于强化学习的安全协议形式化自动验证技术研究


图3.4安全协议通用全自动形式化验证系统框架??

状态图,形式化验证,安全协议,状态


?1?——I???10?^00888???1??Ic864g40?Rule?!KU(?)?9??vk?Rule?IKU(-ii)?§)??vt.l??Step?2?Step?2??????.Rule?丨?Swid(S,l〇?〇m?"|?|?Rule?IKU(?h(k))?g?t?k? ̄|?id?0678c2c8?ID?79b6cc22??(a)?Verification?tree?(b)?Subtree?(c)?Merged?tree??图3.5安全协议全自动形式化验证系统构建状态树的示例??3.3.2信息收集模块??1.选择信息??状态树节点存储信息的选择是系统设计的重要环节。首先,系统将节点存储??信息转换为DQN的输入,由于在验证模块中系统使用DQN在验证树中选择一??个验证路径,DQN的输入状态需代表当前的证明状态。因此,节点信息应可以??表示验证过程中的证明状态。由于网络难以处理高维数据,网络输入的维数不应??太大。所以,系统不选择验证过程产生的所有中间数据作为节点信息。其次,系??统使用节点中的信息来区分不同的证明状态。由于系统逐轮运行,每轮都会构造??并合并状态树。在合并过程中,系统需比较不同树中节点中的信息,以在不同树??中找到相同的证明状态以完成合并。因此,节点存储信息不仅应该足够简单,而??且在验证过程中应代表独立的状态。??整体上看,Tamarin在验证过程中主要生成了如下的中间数据:??1.当前证明步骤编号:该数据用于标识当前证明状态在证明树中所处的位置,??即从节点到根的距离。??2.待证明的目标:该数据用于标识当前证明状态待证明的目标。??

状态图,节点,引理,遍历


rect?Node?—>?Zb?C?:?P(Ai)<l/2?Ai?Bi?P(Bi)>l/2??:?ii\??D?E?]?An-2?Bn-2??Backtracking?Point??n?:??「?厂^一??(DFS)?^A'???An-l?Bn-l??,?:?w??I?.?Detected? ̄ ̄?—? ̄??Detected?Incorrect?Node—>?D?G???|ncorrect—>?An?Bn??.?Node??(a)?:?(b)??图3.7状态树:(a)第一个不正确的节点和第一个被检测到不正确的节点间存在非零距离??(b)在第一次遍历后包含正确引理的节点被选择的概率??2)本系统使用DQN的优势根据上述定理,系统使用的DQN远优于简单算??法。通过在每轮中进行优化,DQN可以调整树中每个节点的Q值,并倾向于选??择具有较高Q值的节点作为“好的节点”,其更有可能包含正确引理。例如,在??图3.7(b)中,假设DQN和简单算法沿着相同的路径[4,遍历,直到正??确性评估算法首次检测到不正确的节点。然后,简单算法从4?开始回溯,并继??续沿[Ao,^,...,^]遍历。假设AQ有两个子节点。根据定理,包含正确引理??的概率小于I即类似地,所有4,A2,…,节点包含正确引理的??概率呈指数下降。因此,£,,成为下一个遍历的节点概率较低。相比之下,DQN??将节点A1;A2,…,A?的奖励设置为负值,以使更新后的策略倾向于选择晃而不??是。实验评估一节也对上述分析进行了验证。??3.4实验评估??3.4.1实验配置??1.实验环境??本章的实验在装有?Mel?Broadwe


本文编号:3617076

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3617076.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4c576***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com