当前位置:主页 > 科技论文 > 软件论文 >

基于软件执行图的行为特性的算法研究

发布时间:2018-05-30 00:13

  本文选题:软件执行图 + 高效用模式 ; 参考:《燕山大学》2016年硕士论文


【摘要】:大数据时代,软件系统规模与应用领域的日益复杂,使得软件动态执行轨迹需要新的处理模式才能成为具有更强决策力与洞察力的信息资产。因此,如何有效地挖掘软件的内在特征,基于软件动态执行轨迹实现其行为特性的建模与算法的研究,成为软件开发质量的基本保障,有助于软件在适用领域的合理应用及发展。本课题利用数据挖掘技术,从海量的软件执行轨迹中挖掘用户感兴趣的行为模式,以适用于广泛的软件安全分析、软件质量评估、软件漏洞挖掘等领域。首先,提出一种基于软件动态执行轨迹的软件执行图的构建方法。基于软件的不同粒度,使用分布函数生成不同粒度下的单元项权重、序列效用值等参数,采用深度优先遍历的方法构建软件执行序列,将每一条序列作为软件的一次函数执行序列,并最终形成软件动态执行序列集合。其次,提出一种基于有希望扩展的高效用序列模式挖掘算法。该算法将软件执行轨迹序列化,设计了表结构Pre-Utility-List用于存储模式的效用信息和索引。为存储长度为2的序列效用值,提出了PEUS结构,并基于此提出一种潜在高效用模式的剪枝策略,有助于模式效用上界值的降低。再次,提出一种基于软件执行图的Top-k高效用路径模式挖掘算法。基于软件执行序列中函数的调用顺序及依赖关系,提出了预插入策略Pre-insertion,以提高初始效用阈值。排序策略Sorting和过滤策略Filtering的使用有助于较早地扩展潜在高效用模式,以提高算法效率。最后,对本文提出的算法用Java语言在Windows平台下进行实现。通过实验分析算法在运行时间、候选集数量、内存使用空间等方面的性能。
[Abstract]:In the era of big data, the scale and application of software system are becoming more and more complex, which makes the dynamic execution path of software need a new processing mode to become an information asset with stronger decision power and insight. Therefore, how to effectively mine the inherent characteristics of software, and how to model and study the algorithm based on the dynamic execution trajectory of software become the basic guarantee of software development quality. It is helpful for the rational application and development of software in the field of application. In this paper, we use data mining technology to mine the behavior patterns of users' interest from the massive software execution path, which can be used in a wide range of software security analysis, software quality assessment, software vulnerability mining and other fields. Firstly, a method of constructing software execution diagram based on software dynamic execution trajectory is proposed. Based on the different granularity of the software, the distribution function is used to generate the cell item weight and the sequence utility value under different granularity, and the depth first traversal method is used to construct the software execution sequence. Each sequence is regarded as the first function sequence of the software, and finally the dynamic execution sequence set of the software is formed. Secondly, a high utility sequential pattern mining algorithm based on promising extension is proposed. The algorithm serializes the software execution trajectory and designs a table structure Pre-Utility-List to store the utility information and index of the schema. In order to store the sequence utility value of length 2, the PEUS structure is proposed, and a pruning strategy of potential high utility pattern is proposed, which is helpful to reduce the upper bound value of pattern utility. Thirdly, a Top-k high utility path pattern mining algorithm based on software execution graph is proposed. Based on the call order and dependency of functions in the software execution sequence, a pre-insertion strategy is proposed to improve the initial utility threshold. The use of sorting strategy Sorting and filtering strategy Filtering helps to extend the potential high utility pattern earlier to improve the efficiency of the algorithm. Finally, the algorithm proposed in this paper is implemented on Windows platform with Java language. The performance of the algorithm in terms of running time, number of candidate sets, memory usage space and so on is analyzed experimentally.
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP311.5

【相似文献】

相关期刊论文 前10条

1 张长海;胡孔法;陈凌;;序列模式挖掘算法综述[J];扬州大学学报(自然科学版);2007年01期

2 肖哲;任胜兵;;序列模式挖掘研究进展[J];科技信息(科学教研);2007年36期

3 陈卓;杨炳儒;宋威;宋泽锋;;序列模式挖掘综述[J];计算机应用研究;2008年07期

4 王虎;丁世飞;;序列模式挖掘研究与发展[J];计算机科学;2009年12期

5 陈晓;;一种模糊序列模式挖掘的有效方法[J];现代计算机(专业版);2010年13期

6 李乃乾;姚新会;田东平;;多时间粒度序列模式挖掘[J];小型微型计算机系统;2011年01期

7 吴孔玲;缪裕青;苏杰;张晓华;;序列模式挖掘研究[J];计算机系统应用;2012年06期

8 聂成林,王浩,胡学钢;基于概念格的序列模式挖掘[J];计算机工程;2003年20期

9 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期

10 许兆新,郝燕玲;约束在序列模式挖掘中的应用研究[J];计算机工程与应用;2004年05期

相关会议论文 前10条

1 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

2 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年

3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

5 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

6 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年

8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

9 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

10 张锐;熊峗;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

相关博士学位论文 前8条

1 张劲松;基于约束的序列模式挖掘及其应用研究[D];上海交通大学;2015年

2 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年

3 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年

4 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年

5 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年

6 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年

7 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年

8 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年

相关硕士学位论文 前10条

1 张长海;分布式序列模式挖掘算法研究[D];扬州大学;2008年

2 陈晓;基于模糊集的序列模式挖掘研究[D];天津大学;2007年

3 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年

4 杨名时;加权负序列模式挖掘算法研究[D];齐鲁工业大学;2015年

5 周慧霞;回归方法估算最长频繁模式长度研究[D];河北工业大学;2015年

6 冯建;基于命题逻辑的频繁序列模式挖掘算法的研究[D];浙江工业大学;2014年

7 廖清科;面向时间序列相似性的序列模式挖掘及应用[D];重庆交通大学;2015年

8 周坤;一般周期间隙约束的序列模式挖掘[D];河北工业大学;2015年

9 甘宇;遥感图像闭序列模式挖掘算法的研究与实现[D];东北大学;2014年

10 田国超;基于极大闭模式的序列投影聚类技术研究[D];东北大学;2014年



本文编号:1953049

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1953049.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69a5d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com