基于节点拓扑特性的网站无障碍抽样方法
发布时间:2020-03-06 11:19
【摘要】:针对已有无障碍网站抽样算法抽取的样本代表性不高,难以满足整体样本数据的分布特征,导致抽样误差大等问题,从网页节点间的拓扑结构入手,提出基于节点拓扑特性的间隔抽样算法.把每个网页作为一个节点,通过邻近构图算法(KNN)建立网页相似度拓扑图;根据节点局部和全局拓扑性质,对节点重要性进行评估和排序;在排序结果的基础上,采用间隔抽样算法,实现不同拓扑区域的分布抽样.真实残联网站上的实验数据表明,基于节点拓扑特性的间隔抽样算法与其他算法相比,在均值误差和分布性上具有更好的效果.
【图文】:
为网页节点的维数.两个网页节点的欧式距离dij为dij=,
本文编号:2585150
【图文】:
为网页节点的维数.两个网页节点的欧式距离dij为dij=,
本文编号:2585150
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2585150.html