当前位置:主页 > 管理论文 > 移动网络论文 >

基于URL聚类的快速无障碍检测抽样方法(英文)

发布时间:2017-08-15 18:03

  本文关键词:基于URL聚类的快速无障碍检测抽样方法(英文)


  更多相关文章: 网页抽样 URL聚类 无障碍检测


【摘要】:目的:大多数残疾人士上网都会遇到各种障碍。为减少上网障碍,对网站进行无障碍检测评估是十分必要的。鉴于大部分网站具有海量网页且某些网页需涉及人工检测,通常利用抽样算法对网站进行无障碍检测评估。已有的分层抽样算法I/O开销和计算代价大。为解决这一问题,本文提出一种基于URL聚类的抽样算法。仅利用URL信息进行聚类,然后抽样,最终实现快速的无障碍检测和评估。创新点:大部分网站的网页内容和URL信息都是由有限数量的模板生成的。因此这些网站的无障碍问题都可以追溯到模板。鉴于同一模板生成的网页具有相似结构和URL模式,可基于URL相似性对网页进行聚类,将同一模板的URL聚到一类中。本文所提抽样算法仅利用网页URL模式信息,无需存储全部网页内容,从而减少I/O开销和计算代价,实现快速的无障碍检测和评估。方法:利用模板生成的网页具有相似URL模式,将URL进行聚类以实现同一模板生成的网页聚在一类中。具体过程:首先,解析爬取到的URL以获取候选URL分词和模板URL分词;然后利用最小长度描述原则进行URL聚类(算法1);最后在每类中按照抽样比例进行抽样。结论:不同于现有的分层抽样算法,本文提出的抽样算法仅利用URL模式信息将网页进行聚类,可减少大量I/O开销和计算代价。
【作者单位】: College
【关键词】网页抽样 URL聚类 无障碍检测
【基金】:Project supported by the National Natural Science Foundation of China(Nos.61173185 and 61173186) the Natural Science Foundation of Zhejiang Province,China(No.LZ13F020001)
【分类号】:TP393.092
【正文快照】: 1 IntroductionWebsite accessibility aims to help people withdisabilities to perceive,understand,navigate,andinteract with the web pages(Abou-Zahra,2008).Theimportance of accessibility is highlighted in theguidelines published by W3C:WCAG 1.0 in 1991and W

【共引文献】

中国硕士学位论文全文数据库 前2条

1 张志超;基于Hadoop的双语语料采集系统[D];哈尔滨工业大学;2013年

2 罗鹏;小概率抽样网络稳定性研究[D];哈尔滨工业大学;2014年

【相似文献】

中国期刊全文数据库 前10条

1 丁明跃,彭嘉雄,万发贯;多级假设检验的两级图象匹配方法[J];电子学报;1989年02期

2 郑小平;丁信伟;冯恩民;唐碧玉;;一种基于基因置换技术的优化算法及其收敛性[J];广西大学学报(自然科学版);2011年06期

3 张卫华;范植华;;基于代价的主动式防御分析[J];通信学报;2007年05期

4 钟武;胡守仁;;OQL逻辑优化准则[J];计算机科学;1998年02期

5 邓宏平;李斌;姚鹏;张文聪;庄镇泉;;一种鲁棒的人眼光斑定位算法[J];中国科学技术大学学报;2011年04期

6 吕洪;王琼;;CG动画探析[J];现代装饰(理论);2013年04期

7 郭庆;;实现实体化视图重计算代价最小化的研究[J];中山大学学报论丛;2007年08期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

中国博士学位论文全文数据库 前1条

1 贺文武;高效预测的核学习方法[D];中南大学;2008年



本文编号:679530

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/679530.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户10844***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com