Web中多媒体资源分析与文本信息提取研究
本文关键词:Web中多媒体资源分析与文本信息提取研究,由笔耕文化传播整理发布。
【摘要】: 随着信息技术的发展与普及,教育信息化成为教育现代化的重要内容和主要标志,它不仅有利于培养学生的创新精神和综合能力、提高教育教学效果,而且为学生的全面发展提供了条件和保障。教育信息资源的开发和利用是教育信息化的核心,它是关系到教育信息化建设成败的关键,对建构主义学习环境的创建起着非常重要的作用,要设计建构主义学习环境,就要为学习者提供丰富的、与问题解决有关的信息资源。 Internet的迅速发展及信息化程度的日渐提高,导致Web中网页的数目呈几何级数爆炸性增长,在这些数目日益增多的网页中包含了大量的多媒体资源,如图像、音频、视频和动画等,并且这些多媒体资源日渐丰富。多媒体资源作为信息资源的重要组成部分,具有形象、生动、直观的优点,在建构主义学习环境中起着非常重要的作用,可以有效的应用于建构主义学习环境的创建。但在浩如烟海并且越来越庞大的Web中快速准确的定位查找自己所需要的多媒体信息资源日渐困难,构建Web多媒体资源库,并使之应用于教育领域,以帮助教师和学习者能快速准确的查找自己所需要的多媒体资源,是教育技术工作者亟待解决的问题。 Web中多媒体资源一般嵌入在网页中,要准确查找并定位这些资源,就需要具有描述这些多媒体资源的信息,形成多媒体资源索引库。但如果采用人工方式对多媒体信息进行标注,效率非常低下,操作也相当繁琐。从多媒体资源所在的网页中自动提取用于描述多媒体资源的文本信息,对Web多媒体资源检索、构建Web多媒体索引库具有积极意义。 对大量包含多媒体资源的网页进行分析,并对各种类型的多媒体资源在网页中的存在形式进行总结,利用Web多媒体网页搜集器广泛搜集包含多媒体资源的网页。在上述工作基础上,本文设计开发了一个Web多媒体资源分析与文本信息提取系统,利用一套启发式规则对网页中的多媒体资源进行区域定位,然后对多媒体资源进行相关文本提取,并对提取的相关文本进行拼音及英文的翻译转换、中文分词、分词结果的消重过滤以及关键词提取等一系列预处理工作,进而形成对网络中多媒体资源的标注索引。 实验结果表明,该系统提取Web多媒体资源的文本信息准确率较高,这对提高多媒体信息检索系统的查全率与查准率具有积极意义。将上述方法应用到教育领域,对于建构主义学习环境的创建,帮助学生更有效准确的查找到自己所需要的多媒体资源,提高教育教学效果具有重要意义。
【关键词】:Web 多媒体 教育资源 信息提取
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09;G434
【目录】:
- 摘要6-8
- ABSTRACT8-10
- 第一章 绪论10-15
- 1.1 研究背景10-12
- 1.1.1 教育技术学科背景10-11
- 1.1.2 网络应用背景11-12
- 1.2 研究现状12-13
- 1.3 本文主要工作13-15
- 1.3.1 研究思路13-14
- 1.3.2 研究内容14
- 1.3.3 本文组织结构14-15
- 第二章 Web 多媒体文本信息提取相关技术15-28
- 2.1 万维网技术15-20
- 2.1.1 万维网简介15-18
- 2.1.2 万维网资源特点18-20
- 2.2 HTML 页面结构与数据特点20-23
- 2.2.1 HTML 页面结构20-22
- 2.2.2 HTML 数据特点22-23
- 2.3 多媒体搜索引擎技术23-25
- 2.4 中文分词技术简介25-27
- 2.5 本章小结27-28
- 第三章 Web 多媒体资源分析28-37
- 3.1 Web 多媒体资源类型与特点28-30
- 3.2 Web 多媒体相关HTML 标记分析30-34
- 3.3 Web 多媒体资源相关文本界定34-35
- 3.4 Web 多媒体资源URL 的获取35-36
- 3.4.1 多媒体资源路径获取35
- 3.4.2 多媒体资源路径转换35-36
- 3.5 本章小结36-37
- 第四章 Web 多媒体文本信息提取37-46
- 4.1 Web 多媒体资源区域定位37-41
- 4.1.1 网页预处理37-38
- 4.1.2 网页表格结构分析38-39
- 4.1.3 多媒体资源区域定位39-41
- 4.2 Web 多媒体资源相关词典构建41-43
- 4.2.1 中文分词词典41-42
- 4.2.2 拼音英文缩写词综合词典42-43
- 4.2.3 无效词过滤词典43
- 4.3 多媒体资源相关文本预处理43-45
- 4.4 Web 多媒体资源关键词提取及标注45
- 4.5 本章小结45-46
- 第五章 Web 多媒体文本信息提取系统的设计与实现46-62
- 5.1 系统结构设计46-47
- 5.2 系统各模块的实现方法47-48
- 5.3 数据库结构设计48-49
- 5.4 关键实现技术49-58
- 5.4.1 网络编程技术49-51
- 5.4.2 动态链接库技术51-53
- 5.4.3 数据库编程技术53-56
- 5.4.4 多线程编程技术56-58
- 5.5 实验结果与分析58-61
- 5.6 本章小结61-62
- 结束语62-63
- 注释63-65
- 参考文献65-68
- 攻读学位期间发表的学术论文68-69
- 致谢69
【相似文献】
中国期刊全文数据库 前10条
1 赵丽娜;周吉顺;;基于WEB的高校网上选课系统的设计与实现[J];电脑知识与技术;2011年18期
2 米新英;;基于Web的通用商品报价系统的研究与实现[J];北华航天工业学院学报;2011年03期
3 朱启英;李明霞;穆玉明;张源明;;基于WEB的考试系统在医学远程教育中的应用[J];中国高等医学教育;2011年06期
4 段静波;潘惠苹;;基于WEB的学院教务管理系统设计与应用[J];电脑知识与技术;2011年17期
5 范毅君;马永威;;浅谈门户网站的设计与在油田中的应用[J];中国石油和化工标准与质量;2011年07期
6 潘生;;基于WEB的人力资源管理专业亲验式教学资源库系统设计[J];电脑知识与技术;2011年23期
7 孙亮;;MPEG-7与多媒体信息检索技术研究综述[J];科技信息;2011年22期
8 杜婷;陶克斌;夏勤;;基于Web的无刷新即时通讯设计与实现[J];重庆科技学院学报(自然科学版);2011年04期
9 王玉华;;Unix平台下的数据库查询开发工具(Web-DTools)的设计与实现[J];信息与电脑(理论版);2011年06期
10 张爱军;;电子商务技术的创新发展趋势[J];电脑知识与技术;2011年26期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报特约撰稿 张娟;用Web 2.0提升知识管理效率[N];计算机世界;2008年
3 厉民;金融风暴冲击Web2.0产业[N];人民邮电;2008年
4 电脑商报记者 周雪;Web安全市场须冷却慎行[N];电脑商报;2008年
5 郭川;Web2.0:新花样层出不穷[N];人民邮电;2008年
6 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
7 本报记者 李飞虎;Web 2.0[N];中国计算机报;2008年
8 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
9 商报记者 吴辰光;Web2.0凸显空洞概念[N];北京商报;2009年
10 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
中国博士学位论文全文数据库 前10条
1 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
2 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
3 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
4 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
5 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
6 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
7 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
8 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
9 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
10 刘铁江;组合Web服务选择、部署与执行的关键技术研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 于文超;Web中多媒体资源分析与文本信息提取研究[D];山东师范大学;2010年
2 张囡;基于概念的语义Web服务匹配算法的研究及其在配送中心系统的应用[D];华南理工大学;2010年
3 张敏;面向Web应用的测试适配技术研究[D];山东师范大学;2010年
4 涂丘;一种基于Web界面的协同文档管理系统的部署与实施[D];电子科技大学;2010年
5 崔宏亮;面向Web服务体系的协同办公系统的设计与实现[D];电子科技大学;2010年
6 高洁;基于Web信息的内容及其特征提取方法的研究[D];电子科技大学;2010年
7 李鹏;基于信誉度的Web服务选择研究[D];湖南工业大学;2009年
8 马丽莎;基于WEB操作平台下的办公自动化系统[D];电子科技大学;2009年
9 向剑峰;基于OWL-S的语义Web服务组合模型的研究[D];湖北工业大学;2011年
10 郭清军;P2P语义web服务研究与实现[D];广东工业大学;2011年
本文关键词:Web中多媒体资源分析与文本信息提取研究,,由笔耕文化传播整理发布。
本文编号:402166
本文链接:https://www.wllwen.com/jiaoyulunwen/jykj/402166.html