学前教育多媒体资源搜索服务系统设计
发布时间:2017-10-23 15:20
本文关键词:学前教育多媒体资源搜索服务系统设计
更多相关文章: 文本分类 多媒体资源检索 噪音过滤 学前教育
【摘要】:随着互联网技术的发展,形形色色的学前教育机构或者个人在Internet上发布了各自的学前教育资源。这些资源的丰富程度超过了以往的任何单个单位的资源,它几乎能够提供已有的关于学前教育的所有资源。在现代社会条件下,如果某一学前教育机构不能有效的整合网络中的网页资源,那么该机构的发展将会受到极大的限制。同样的,如果家长不能有效的获取自己想要的学前教育资源,其家庭学前教育水平就无法充分地得到信息化给教育带来的便利性。 本文设计了一个基于学前教育主题的多媒体资源检索系统,主要实现了网页中提取多媒体资源,多媒体相关文本信息解析,基于文本的学前教育主题类多媒体资源自动分类以及网页中多媒体类噪音的过滤,为学前教育领域的相关人员提供主题多媒体资源检索服务。 首先,我们对系统作了一番需求分析,简要地介绍了系统设计的时代背景和多媒体资源的一些特点。在此基础上,我们进一步阐释了系统设计的目标内容和实现方案。 接着,我们详细介绍了多媒体检索及其相关技术的研究现状,并就多媒体检索领域的一些关键性的技术(如主题蜘蛛、自动分类、网页去噪等)研究作了详细的描述。 随后,我们先从整体上介绍了系统的结构并对各部分的功能逐个进行详细说明。在此基础上我们就系统数据库设计作了必要的说明。 然后,我们分别就系统中涉及到的两个关键算法:基于TFIDF和空间向量模型(Vector Space Model, VSM)的多媒体类资源自动分类算法和学前教育主题下多媒体类噪音资源过滤算法作了分别的介绍。在介绍分类算法的实现过程中,我们详细地介绍了从训练集整理到分类器评价过程中的每个步骤,包括其中遇到的困难和解决方法。在过滤算法中,我们首先分析统计了学前教育领域内主题相关资源与非主题相关资源之间的差异,总结出非主题相关资源所具有的一系列的特点,在此基础上设计了基于规则的多媒体类噪音过滤算法。 此后,为检验上述两个算法的实际使用效果,我们利用自己设计的网络蜘蛛爬取了一定量的多媒体资源及其相关信息,使用这些数据从不同的角度测试两个算法的效果。实验数据表明这两个算法在基于学前教育主题的多媒体检索系统中能够取得较为满意的效果。 最后,我们就系统设计工作中存在的不足和其它有待于改进的地方作了必要地阐述。
【关键词】:文本分类 多媒体资源检索 噪音过滤 学前教育
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3;G434
【目录】:
- 摘要3-4
- Abstract4-6
- 目录6-8
- 第1章 绪论8-13
- 1.1 研究背景8
- 1.2 研究现状8-11
- 1.2.1 国外研究现状9
- 1.2.2 国内研究现状9-10
- 1.2.3 多媒体技术发展趋势10-11
- 1.3 本文的主要工作11
- 1.4 论文创新点概述11-12
- 1.5 文章结构安排12-13
- 第2章 系统分析13-22
- 2.1 需求分析13-14
- 2.1.1 我国学前教育发展概况13
- 2.1.2 学前教育类多媒体资源的教学意义13-14
- 2.1.3 通用搜索引擎的局限性14
- 2.2 多媒体资源特点分析14-18
- 2.2.1 多媒体资源类型及特点14-15
- 2.2.2 网页中多媒体数量统计15-16
- 2.2.3 多媒体资源的HTML表示16-17
- 2.2.4 多媒体元数据描述17-18
- 2.3 系统设计18-21
- 2.3.1 设计目标18
- 2.3.2 设计内容18-19
- 2.3.3 系统实现方案19-21
- 2.4 本章小结21-22
- 第3章 相关技术研究22-30
- 3.1 主题蜘蛛22-23
- 3.1.1 主题蜘蛛的运行方式22
- 3.1.2 鱼群算法22-23
- 3.2 文本信息抽取23-24
- 3.2.1 网页文本的特点23-24
- 3.2.2 一般处理方法24
- 3.2.3 相关的开源组件24
- 3.3 文本分类24-26
- 3.3.1 国外Web文本自动分类24-25
- 3.3.2 国内Web文本自动分类25-26
- 3.4 噪音过滤26
- 3.5 多媒体信息系统检索技术研究26-29
- 3.5.1 基于文本的多媒体资源检索27
- 3.5.2 基于内容的多媒体资源检索27-29
- 3.6 本章小结29-30
- 第4章 系统体系结构设计30-43
- 4.1 系统总体设计30-31
- 4.2 数据库设计31-32
- 4.3 系统核心算法设计32-42
- 4.3.1 基于文本的多媒体自动分类算法32-39
- 4.3.2 多媒体类网页噪音过滤算法设计39-42
- 4.4 本章小结42-43
- 第5章 数据处理过程和实验结果分析43-50
- 5.1 实验环境说明43
- 5.2 系统取得的数据43-44
- 5.2.1 系统多媒体资源类别说明43
- 5.2.2 数据统计43-44
- 5.3 基于规则的多媒体类噪音过滤算法过滤效果分析44-46
- 5.3.1 选取的多媒体总数及各类别的多媒体的总数44
- 5.3.2 各类别的过滤概率44-45
- 5.3.3 去噪算法有待于改进的地方45-46
- 5.4 基于TFIDF和空间向量模型的自动分类算法设计46-49
- 5.4.1 与学前教育主题相关度较高的关键词统计46-47
- 5.4.2 维度对准确率和消耗时间的影响47-48
- 5.4.3 待改进的地方48-49
- 5.5 本章小结49-50
- 第6章 工作总结与展望50-52
- 6.1 本文总结50-51
- 6.1.1 改进抽取资源的方法50
- 6.1.2 设计多媒体噪音的过滤方法50
- 6.1.3 基于文本的多媒体资源自动分类50-51
- 6.2 后期工作安排51-52
- 参考文献52-55
【参考文献】
中国期刊全文数据库 前10条
1 彭玉容;杨捧;高媛;;农业搜索引擎的发展现状及关键技术研究[J];安徽农业科学;2010年20期
2 谢超;陈毓芬;;洛阳多媒体旅游信息系统设计与实现[J];测绘科学;2008年01期
3 孟祥增;;多媒体网络教学资源的内容特征提取与搜索研究[J];电化教育研究;2007年12期
4 骆秀曼;;浅谈多媒体技术在幼儿教育中的应用[J];黑龙江科技信息;2009年05期
5 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
6 王本年,高阳,陈世福,谢俊元;Web智能研究现状与发展趋势[J];计算机研究与发展;2005年05期
7 张鹰;;基于CRP理念的学习化社区网络建构[J];江苏广播电视大学学报;2010年01期
8 钱功伟;倪林;曹荣;;基于网页链接和内容分析的改进PageRank算法[J];计算机工程与应用;2007年21期
9 方加沛;黄战;;基于单类别文档分类的主题爬虫[J];计算机工程与应用;2010年16期
10 王丽坤;王宏;陆玉昌;;文本挖掘及其关键技术与方法[J];计算机科学;2002年12期
,本文编号:1084038
本文链接:https://www.wllwen.com/jiaoyulunwen/wangluojiaoyulunwen/1084038.html