网页图片无障碍替代文本自动生成算法设计与实现
本文关键词:网页图片无障碍替代文本自动生成算法设计与实现,由笔耕文化传播整理发布。
【摘要】:在当今高度信息化的社会中,视力缺陷的残疾人因为其生理上的缺陷,不能像普通群体一样,享受到互联网时代所带来的高效和便捷。网站无障碍改造技术旨在帮助残疾人群体,使他们便利地访问互联网资源,平等地融入到互联网时代的大潮之中。常用的网页图片无障碍改造技术,会将检测出不符合无障碍指导规范的图片,直接交付人工进行标注。这样操作会带来大量人力工作量,于此同时,因为无障碍改造志愿者个人认知的不同,直接标注还会引入个人对图片内容理解的主观偏差,造成残疾人在浏览网页时会因为图片内容和对应环绕文本内容的不统一而产生混淆。本文面向有视力缺陷的残疾人群体,设计了一种面向网站无障碍的网页图片替代本文半自动生成方法。该方法通过提取网页图片和其环绕文本中的信息,能够为网页图片生成替代文本候选集,以辅助完成人工标注,降低其工作量。该方法应用图像显著性检测技术提取网页图片中的主体内容区域,并以提取出的主体内容和环绕文本中的关键词信息为顶点构建混合图模型。然后,通过马尔可夫随机走过程求解与图片关联度最大的多个候选词。以此作为系统的输出结果,进一步交付给专业机构或网络众包平台,用于辅助人工完成对网页图片的人工标注和改造工作。较已有的网页图片无障碍改造方法,本方法能够使参与无障碍改造的工作人员更为直观的获取图片中的主体内容信息,并通过候选替代文本集来对人工标注作一定的引导和噪音抑制效果。帮助其提供更有针对性的标注网页图片替代文本。本方法还进一步利用图像显著性检测所得结果,计算主要物体在原始图像中的相对位置信息,并据此为无障碍改造工作人员提供可选择的替代文本模板。实验证明,本文提出的方法具有一定的实践可行性,能够有效完善网页图片无障碍改造系统。
【关键词】:网站信息无障碍 无障碍改造 显著性检测 半自动生成
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41;TP393.092
【目录】:
- 摘要4-5
- Abstract5-11
- 第1章 绪论11-15
- 1.1 课题背景11
- 1.2 研究动机与研究意义11-13
- 1.3 本文主要工作13-14
- 1.4 本文的组织结构14
- 1.5 本章小结14-15
- 第2章 相关技术与理论综述15-25
- 2.1 网站内容无障碍访问15-19
- 2.1.1 网页内容可访问性指导规范15-17
- 2.1.2 编写工具可访问性指导规范17
- 2.1.3 用户代理可访问性指导规范17-18
- 2.1.4 网站内容无障碍国内发展现况18-19
- 2.2 常用的网页无障碍改造技术19-21
- 2.3 图像特征提取理论与常用方法21-23
- 2.3.1 颜色特征提取21
- 2.3.2 边缘特征提取21-22
- 2.3.3 纹理特征提取22-23
- 2.4 马尔可夫随机走模型理论基础23-24
- 2.5 本章小结24-25
- 第3章 网页图片半自动改造框架设计25-30
- 3.1 框架设计思路25-27
- 3.2 系统总体架构27-28
- 3.3 图片无障碍改造模块设计28-29
- 3.3.1 图片关键区域检测组件28-29
- 3.3.2 图片替代文本学习框架29
- 3.3.3 图片替代文本生成组件29
- 3.3.4 改造报告生成组件29
- 3.4 本章小结29-30
- 第4章 图片关键内容检测组件设计和实现30-46
- 4.1 组件的设计思路和工作流程30-32
- 4.1.1 设计思路30-31
- 4.1.2 组件工作流程图31-32
- 4.2 关键区域检测组件模块分析32-34
- 4.2.1 显著性检测模块32-33
- 4.2.2 显著性分割模块33
- 4.2.3 关键区域提取模块33-34
- 4.3 图片关键区域检测组件功能实现34-41
- 4.3.1 原图片所对应的显著性图的生成34-39
- 4.3.2 基于显著图生成二值主体内容掩膜39-40
- 4.3.3 显著性物体区域的提取40-41
- 4.4 图片关键区域检测实验与结果分析41-44
- 4.4.1 实验样本数据41-42
- 4.4.2 实验结果和分析42-44
- 4.5 本章小结44-46
- 第5章 基于混合图的图片替代文本候选集生成算法46-67
- 5.1 图片关键区域图像特征提取46-48
- 5.2 以图片和关键词为定点的混合图构建48-52
- 5.2.1 图片顶点到图片顶点间边的构建49-50
- 5.2.2 图片顶点到关键词顶点间边的构建50-51
- 5.2.3 关键词顶点到图片顶点间边的构建51-52
- 5.3 基于马尔可夫随机走模型图片替代文本候选集生成算法52-56
- 5.4 实验设计及验证56-66
- 5.4.1 实验环境和数据集56-58
- 5.4.2 实验参数设置和评判标准58-59
- 5.4.3 实验结果及分析59-66
- 5.5 本章小结66-67
- 第6章 总结与展望67-69
- 6.1 论文总结67
- 6.2 工作展望67-69
- 参考文献69-73
- 致谢73
【相似文献】
中国期刊全文数据库 前10条
1 朱松岩;;网页设计之特性分析[J];山东省农业管理干部学院学报;2009年03期
2 安琳;;国外网页信息存档项目及相关问题研究[J];图书馆建设;2009年12期
3 蒋桂梅;;网页设计的艺术性[J];电脑知识与技术;2010年05期
4 龙正义;;网页长期保存的策略与方法研究[J];档案管理;2010年03期
5 李志义;梁士金;;国内网页去重技术研究:现状与总结[J];图书情报工作;2011年07期
6 王烁;;美国网页归档项目——Internet Archive发展研究[J];兰台世界;2012年17期
7 栗勇兵;韩平;董启雄;;网页信息自动提取的设计与实现[J];计算机光盘软件与应用;2012年18期
8 何立波;周世波;;网页设计中的艺术研究[J];考试周刊;2011年25期
9 秦永平;网页信息共享技术[J];计算机应用;2000年02期
10 项镇;网页设计新概念[J];江西教育学院学报(自然科学);2001年06期
中国重要会议论文全文数据库 前10条
1 吴建军;;谈网页设计的艺术性表现[A];经天纬地——全国测绘科技信息网中南分网第十九次学术交流会优秀论文选编[C];2005年
2 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 曹淮;晁丁丁;;3D元素在网页信息传达中的应用研究[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
6 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
7 马骁;王晓龙;王轩;卜永忠;;基于网页信息结构的网页体裁聚类分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
9 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 王宇;黄炜;肖艳芹;任建立;李天柱;;ORBASE用于基于内容的Web查询[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
中国重要报纸全文数据库 前10条
1 本报记者 曾居仁 通讯员 郝金荣;贵州“万村千乡”网页工程开辟为农服务新渠道[N];中国气象报;2012年
2 壮壮;批量保存网页信息[N];电脑报;2004年
3 罗震宇 严小斌;一种新型WEB开发技术的探讨[N];中国冶金报;2011年
4 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
5 星之海洋;迈出网页制作的第一步[N];电脑报;2004年
6 河南 张金贵;FrontPage2000组件详解(四)[N];电脑报;2001年
7 枫尔;网站浏览提速的五大秘方[N];中国证券报;2004年
8 飘零剑客;网络监控利器——AnyView[N];中国电脑教育报;2004年
9 八戒;眨眼之间 答案立现[N];电脑报;2013年
10 ;网络应用 天龙八“步” 申请上网账号[N];电脑报;2002年
中国博士学位论文全文数据库 前10条
1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
2 龚昌盛;基于语义标注的网页广告加载模型研究[D];武汉大学;2010年
3 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
4 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年
5 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
6 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
7 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
8 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
9 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年
10 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 敖志敏;基于网页相似度的搜索算法改进的研究[D];上海师范大学;2015年
2 杨寻;地域文化的视觉元素在旅游网页设计中的应用研究[D];西南交通大学;2015年
3 张W,
本文编号:309672
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/309672.html