基于HTML5的网页转换系统的设计与实现
发布时间:2017-04-15 21:08
本文关键词:基于HTML5的网页转换系统的设计与实现,由笔耕文化传播整理发布。
【摘要】:近年来,移动客户端得到迅猛的发展,越来越多的用户通过移动端来访问WEB资源,移动办公的需求也逐渐体现出来。目前的网络资源几乎都是为带宽高、屏幕大的PC终端所准备,当移动用户直接访问这些资源的时候,大多数时候都会出现终端不匹配的问题。如果重新为移动终端创建资源,资源就出现了极大的浪费,相对成本也很好。为了快速有效的解决这个问题,可以考虑将PC网页转化为移动端适配的网页。 本文以实现一个一键网页转换系统为目标,首先调研了已有的各种网页分块算法,在导航类网页实现了一种全新的基于重复单元的网页分块算法,对于正文类网页实现了基于行块分布函数的通用网页正文抽取方法,两种方法的结合使用,分别发挥了两种方法的特点,使转化快速准确有效。然后本文实现了一个OFFICE系列和PDF文件转换为HTML格式文件的系统,在进行了大量的调研分析和尝试后,实现了一个扩展良好的解决方案,能随着来源文件格式版本的升级而升级。最后,基于内容识别和文档转换的结果,结合前端的HTML5、JS和CSS技术,实现了一个前端的驱动程序库和显示样式库。由前端驱动控制整个程序的运行、数据的初始化更新、网页的重建工作,由显示库为重建的网页提供美观适配的显示效果。
【关键词】:网页转换 文档转换 HTML5 移动互联网 网页分块
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 绪论10-14
- 1.1. 研究背景及意义10-11
- 1.1.1. 研究背景10-11
- 1.1.2. 课题研究的意义11
- 1.2. 网页转换系统概述11-12
- 1.2.1. 网页分块12
- 1.2.2. 文档转换12
- 1.2.3. 网页重构12
- 1.3. 本文研究内容与论文结构12-14
- 第二章 系统设计及网络架设14-17
- 2.1. 模块设计14-15
- 2.2. 网络架设15-16
- 2.2.1. 请求处理服务器15-16
- 2.2.2. 文档转换服务器16
- 2.2.3. 网页转换服务器16
- 2.2.4. 图片转换服务器16
- 2.2.5. WEB服务器16
- 2.3. 本章小结16-17
- 第三章 内容抽取与识别17-24
- 3.1. 已有的网页内容抽取方法17-19
- 3.1.1. 基于Dom树的相关方法17
- 3.1.2. 基于网页分割的相关方法17-18
- 3.1.3. 基于标记窗的相关方法18
- 3.1.4. 基于数据挖掘或机器学习的相关方法18
- 3.1.5. 基于网页中正文特征的相关方法18-19
- 3.2. 导航页面内容抽取19-20
- 3.2.1. 基于重复单元的网页分块算法19
- 3.2.2. 重复块的快速查找19-20
- 3.2.3. 分块定义和处理20
- 3.3. 内容页面正文抽取20
- 3.4. 导航页面与正文页面类型判别20-21
- 3.5. 测试结果及结论21-23
- 3.5.1. 导航页内容抽取21-22
- 3.5.2. 正文页内容抽取22
- 3.5.3. 网页类型判断22-23
- 3.6. 本章小结23-24
- 第四章 文档转换24-36
- 4.1. 业务流程24
- 4.2. 技术方案选择24-28
- 4.2.1. 将Word文档转换为HTML525-27
- 4.2.2. 将PDF等转换为HTML527-28
- 4.2.3. 图片的处理28
- 4.3. 模块详细设计28-32
- 4.3.1. 请求处理与控制模块29-30
- 4.3.2. Office转换模块30-32
- 4.3.3. PDF模块32
- 4.4. 结果下载与预览32-33
- 4.4.1. 软件选择32
- 4.4.2. 使用方法32-33
- 4.5. 接口定义33-34
- 4.5.1. HTTP转换请求接口说明33
- 4.5.2. 结果预览接口33
- 4.5.3. 结果压缩包下载接口33-34
- 4.6. 系统测试34-35
- 4.6.1. 测试环境(服务器配置)说明34
- 4.6.2. 测试环境客户端34
- 4.6.3. 测试方法34-35
- 4.6.4. 测试结果35
- 4.7. 本章小结35-36
- 第五章 HTML5应用重构36-50
- 5.1. 背景知识概述36-38
- 5.1.1. 超文本标记语言文件36
- 5.1.2. 级联样式表36-37
- 5.1.3. JavaScript和Ajax、JSON37
- 5.1.4. HTML537-38
- 5.2. 系统驱动的设计与实现38-40
- 5.2.1. 驱动控制程序的安装38-39
- 5.2.2. 数据的缓存与更新策略39-40
- 5.3. 应用重构的实现40-43
- 5.3.1. 块结构(Block)40
- 5.3.2. JSON数据特征40-41
- 5.3.3. 遍历的实现41-43
- 5.4. 样式展示效果的基本设计与实现43-46
- 5.4.1. CSS框模型及元素定位43-44
- 5.4.2. 用DIV+CSS进行网页布局44
- 5.4.3. 页面布局——global.css44-45
- 5.4.4. 响应式布局45-46
- 5.5. 测试显示效果46-49
- 5.5.1. 测试方法46
- 5.5.2. 测试环境46
- 5.5.3. 测试效果46-49
- 5.6. 本章小结49-50
- 第六章 结束语50-52
- 6.1. 论文总结50
- 6.2. 尚存在的问题50-52
- 参考文献52-53
- 附录1 缩略语53-54
- 致谢54
【参考文献】
中国期刊全文数据库 前10条
1 李慧云;杨新章;胡文胜;文锦军;;基于HTML5的移动互联网应用转换技术[J];电信科学;2013年05期
2 王政;;Web前端开发技术以及优化研究[J];电脑知识与技术;2013年22期
3 陈辉;;移动智能终端渐成智能家居控制主流[J];中国公共安全(综合版);2012年16期
4 张霞亮;陈家骏;;基于逻辑行和最大接纳距离的网页正文抽取[J];计算机工程与应用;2009年25期
5 赵欣欣;索红光;刘玉树;;基于标记窗的网页正文信息提取方法[J];计算机应用研究;2007年03期
6 陈慧;;DIV+CSS网站布局之最优化设计[J];科技信息;2012年01期
7 孙承杰,关毅;基于统计的网页正文信息抽取方法的研究[J];中文信息学报;2004年05期
8 黄晓武;;虚拟化技术在高校移动办公中的应用[J];信息通信;2013年01期
9 吴东方;;手机移动终端OA办公的设想[J];青春岁月;2013年19期
10 高乐;张健;田贤忠;;基于视觉的Web页面分块算法的改进与实现[J];计算机系统应用;2009年04期
本文关键词:基于HTML5的网页转换系统的设计与实现,由笔耕文化传播整理发布。
,本文编号:309243
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/309243.html