基于网页元素主题识别的XPath定位器生成算法研究
发布时间:2021-05-14 21:34
为了保证Web应用程序的质量,Web应用必须进行相应的测试。随着Web应用程序规模和结构复杂性的增加,回归测试行为往往受到时间等资源的限制。因此,Web测试效率亟待提高。越来越多的自动化测试工具正在被广泛使用,这些工具能在一定程度上提高Web测试效率。但在回归测试中,固定不变的网页元素定位器十分脆弱,往往会导致测试用例失效。为此,本文提出相应的方法来自动生成网页元素XPath定位器,通过爬取网页页面内容,采用主题模型识别网页元素主题,最终自动生成网页元素的XPath定位器。针对静态页面,本文分析了静态页面网页元素定位器失效的原因,提出了主题词库、提取特征词算法以及主题判定方法,设计了自动生成网页元素XPath路径算法,实现了静态页面网页元素XPath定位器的生成。该方法在静态页面中,通过限定网页元素主题、限定网页元素标签名等方式,具有所需样本少,时间复杂度低等优点。针对动态页面,本文分析了动态页面网页元素定位器失效的原因,提出了动态页面中的提取特征词算法、网页元素预处理方法,研究了使用pLSA主题模型和EM算法确定网页元素主题的方法,设计了结合网页状态流图自动生成网页元素XPath定位...
【文章来源】:上海师范大学上海市
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究进展
1.2.1 提高XPath定位器鲁棒性的相关研究
1.2.2 判定网页元素主题的相关研究
1.2.3 生成网页元素定位器的相关研究
1.2.4 网页状态流图的相关研究
1.3 课题来源
1.4 论文研究内容和创新点
1.4.1 论文的研究内容
1.4.2 论文创新点
1.5 论文结构
第2章 相关知识
2.1 Web测试
2.2 网页元素相关概念
2.3 网页状态流图
2.4 网络爬虫技术
2.5 文本主题模型
2.6 基于网页元素主题识别的XPath定位器生成算法框架
2.7 本章小结
第3章 静态页面的网页元素XPath定位器生成方法
3.1 静态页面网页元素定位器失效原因分析
3.2 实例概述
3.3 主题词库
3.3.1 主题关键词集合
3.3.2 提取特征词
3.3.3 主题特征词频次
3.4 基于主题判定的网页元素XPath定位器生成方法
3.4.1 确定网页元素主题
3.4.2 网页元素XPath路径生成
3.5 本章小结
第4章 动态页面的网页元素XPath定位器生成方法
4.1 动态页面网页元素定位器失效原因分析
4.2 实例概述
4.3 网页状态流图生成方法
4.4 基于pLSA的网页元素主题判定方法
4.4.1 网页元素预处理
4.4.2 pLSA模型
4.4.3 EM算法求解
4.5 动态页面网页元素XPath定位器生成方法
4.6 本章小结
第5章 实验与结果分析
5.1 实验环境与设置
5.1.1 实验环境
5.1.2 实验设置
5.2 实验内容
5.2.1 网页元素主题识别的准确率
5.2.2 网页元素定位能力
5.2.3 网页元素定位器的鲁棒性
5.3 实验结果与分析
5.4 本章小结
第6章 结论与展望
6.1 结论
6.2 进一步工作的方向
参考文献
攻读学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]一种Web应用跨浏览器兼容性测试方法[J]. 韦庆杰,刘淑坤. 计算机工程与应用. 2019(05)
[2]关于渗透测试在Web软件系统安全性测试中的应用研究[J]. 徐莺,冯亚玲,邓丹,王小娟. 通信技术. 2018(09)
[3]基于Selenium的Web软件自动化测试[J]. 姜文,刘立康. 计算机技术与发展. 2018(09)
[4]服务接口测试自动化工具的研究[J]. 卓欣欣,白晓颖,许静,李恩鹏,刘喻,康介恢,宋文莉. 计算机研究与发展. 2018(02)
[5]基于模式生成的浏览器模糊测试技术[J]. 霍玮,戴戈,史记,龚晓锐,贾晓启,宋振宇,刘宝旭,邹维. 软件学报. 2018(05)
[6]GUI测试中多级形态模型的分割与应用[J]. 王皓亮,高建华. 计算机科学. 2017(09)
[7]融合潜在主题信息和卷积语义特征的文本主题分类[J]. 陈培新,郭武. 信号处理. 2017(08)
[8]基于XPath路径的Web应用测试脚本修复[J]. 王曙燕,王璇,孙家泽. 计算机应用研究. 2017(05)
[9]基于Petri网的图形用户界面测试[J]. 林涛,高建华. 计算机应用研究. 2016(03)
[10]基于主题模型和统计机器翻译方法的中文格律诗自动生成[J]. 蒋锐滢,崔磊,何晶,周明,潘志庚. 计算机学报. 2015(12)
硕士论文
[1]GUI测试用例修复技术的研究[D]. 赖盛鑫.上海师范大学 2018
[2]基于AngularJS的单一页面web应用图形用户界面的测试研究[D]. 沈毅俊.上海师范大学 2016
[3]基于HTML代码分析的Web应用自动化测试方法研究[D]. 陈少林.东南大学 2015
[4]基于LDA多模型中文短文本主题分类体系构建与分类[D]. 郭剑飞.哈尔滨工业大学 2014
本文编号:3186368
【文章来源】:上海师范大学上海市
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究进展
1.2.1 提高XPath定位器鲁棒性的相关研究
1.2.2 判定网页元素主题的相关研究
1.2.3 生成网页元素定位器的相关研究
1.2.4 网页状态流图的相关研究
1.3 课题来源
1.4 论文研究内容和创新点
1.4.1 论文的研究内容
1.4.2 论文创新点
1.5 论文结构
第2章 相关知识
2.1 Web测试
2.2 网页元素相关概念
2.3 网页状态流图
2.4 网络爬虫技术
2.5 文本主题模型
2.6 基于网页元素主题识别的XPath定位器生成算法框架
2.7 本章小结
第3章 静态页面的网页元素XPath定位器生成方法
3.1 静态页面网页元素定位器失效原因分析
3.2 实例概述
3.3 主题词库
3.3.1 主题关键词集合
3.3.2 提取特征词
3.3.3 主题特征词频次
3.4 基于主题判定的网页元素XPath定位器生成方法
3.4.1 确定网页元素主题
3.4.2 网页元素XPath路径生成
3.5 本章小结
第4章 动态页面的网页元素XPath定位器生成方法
4.1 动态页面网页元素定位器失效原因分析
4.2 实例概述
4.3 网页状态流图生成方法
4.4 基于pLSA的网页元素主题判定方法
4.4.1 网页元素预处理
4.4.2 pLSA模型
4.4.3 EM算法求解
4.5 动态页面网页元素XPath定位器生成方法
4.6 本章小结
第5章 实验与结果分析
5.1 实验环境与设置
5.1.1 实验环境
5.1.2 实验设置
5.2 实验内容
5.2.1 网页元素主题识别的准确率
5.2.2 网页元素定位能力
5.2.3 网页元素定位器的鲁棒性
5.3 实验结果与分析
5.4 本章小结
第6章 结论与展望
6.1 结论
6.2 进一步工作的方向
参考文献
攻读学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]一种Web应用跨浏览器兼容性测试方法[J]. 韦庆杰,刘淑坤. 计算机工程与应用. 2019(05)
[2]关于渗透测试在Web软件系统安全性测试中的应用研究[J]. 徐莺,冯亚玲,邓丹,王小娟. 通信技术. 2018(09)
[3]基于Selenium的Web软件自动化测试[J]. 姜文,刘立康. 计算机技术与发展. 2018(09)
[4]服务接口测试自动化工具的研究[J]. 卓欣欣,白晓颖,许静,李恩鹏,刘喻,康介恢,宋文莉. 计算机研究与发展. 2018(02)
[5]基于模式生成的浏览器模糊测试技术[J]. 霍玮,戴戈,史记,龚晓锐,贾晓启,宋振宇,刘宝旭,邹维. 软件学报. 2018(05)
[6]GUI测试中多级形态模型的分割与应用[J]. 王皓亮,高建华. 计算机科学. 2017(09)
[7]融合潜在主题信息和卷积语义特征的文本主题分类[J]. 陈培新,郭武. 信号处理. 2017(08)
[8]基于XPath路径的Web应用测试脚本修复[J]. 王曙燕,王璇,孙家泽. 计算机应用研究. 2017(05)
[9]基于Petri网的图形用户界面测试[J]. 林涛,高建华. 计算机应用研究. 2016(03)
[10]基于主题模型和统计机器翻译方法的中文格律诗自动生成[J]. 蒋锐滢,崔磊,何晶,周明,潘志庚. 计算机学报. 2015(12)
硕士论文
[1]GUI测试用例修复技术的研究[D]. 赖盛鑫.上海师范大学 2018
[2]基于AngularJS的单一页面web应用图形用户界面的测试研究[D]. 沈毅俊.上海师范大学 2016
[3]基于HTML代码分析的Web应用自动化测试方法研究[D]. 陈少林.东南大学 2015
[4]基于LDA多模型中文短文本主题分类体系构建与分类[D]. 郭剑飞.哈尔滨工业大学 2014
本文编号:3186368
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3186368.html