当前位置:主页 > 教育论文 > 学科教育论文 >

Web教育资源内容切片研究

发布时间:2017-11-15 09:02

  本文关键词:Web教育资源内容切片研究


  更多相关文章: Web教育资源 正文提取 模式识别 内容切片 颗粒度


【摘要】:随着移动互联网时代的极大推进,大量的信息都通过各种移动终端传递给社会大众,每个人都能够在任何时间任何地点通过各种移动设备快速获取资源。然而现在丰富多彩、类型各异的网络资源,基本都是以PC平台为标准设计的,适合移动终端页面的教育资源非常少,因此从资源共享、减少重复开发的视角出发,充分发挥现有Web教育资源的利用率,将丰富的Web教育资源引进到移动终端页面上,让人们进行有效的移动学习是现代教育理论中移动教育必须要实现的目标。本文针对将丰富的Web教育资源引进到移动终端页面从而适合移动学习,提出了有效且具有泛化能力的Web教育资源内容提取及切割技术,主要包括Web教育资源网页内容的提取和资源内容的切片处理。本文的主要研究工作具体包括以下内容:1、提出一种基于改进的行块分布函数的多线索网页内容提取算法。该算法是通过分析网页的特殊HTML标签、网页中文本语义信息的文本特征、网页结构格式信息的视觉布局特征这三种线索,对网页进行预处理,获得了粗糙的网页正文内容,然后结合改进的行块分布函数对网页内容进行提取。2、介绍了Web教育资源内容切片颗粒度。切片颗粒度是对资源文本进行切割最基本的要素,明确了颗粒度的大小才能进行切割处理。针对不同类型的资源文本,考虑布局信息和句子、文本段落、文本块层次来确定颗粒度的大小。3、提出了一种基于模式识别的HMM文本切割算法。该算法是根据资源文本的文本语义特征和视觉布局特征结合正则表达式匹配来判断文本子主题的边界,获得文本语义块序列,再结合HMM模型精确判断文本边界以完成文本切割,获得文本内容切片。实验表明,将HMM模型应用到文本切割中是较理想的,切片效果很好。4、以教案类和试题类资源为例,具体讲述Web教育资源主题网页内容提取及切割技术。由于资源类型比较多,且不同类型资源方法略有不同,所以本文对颇具特殊形式的教案类资源和试题类资源进行算法介绍,并且针对随机抓取的网页进行实验验证,以证明两类资源的算法有效性和泛化能力。
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:G434

【相似文献】

中国期刊全文数据库 前10条

1 项镇;网页设计新概念[J];江西教育学院学报(自然科学);2001年06期

2 王海燕;张正凯;任建浩;;从审美角度浅谈网页艺术设计[J];中国电化教育;2004年09期

3 贾海龙,任玉珍;网页艺术设计[J];新乡师范高等专科学校学报;2005年05期

4 刘肖冰;浅谈网页艺术设计[J];安阳师范学院学报;2005年05期

5 孙迎春;;网页设计研究[J];南平师专学报;2005年03期

6 文涛;网页的视觉传达设计与分析[J];沈阳教育学院学报;2005年01期

7 张秀虎;;浅谈网页的访问权限[J];教育信息化;2005年17期

8 魏娜;;浅谈网页艺术设计[J];新课程研究(职业教育);2007年09期

9 方园;;浅析艺术设计在网页中的运用[J];湖北经济学院学报(人文社会科学版);2007年02期

10 赵锋;;《计算机网页设计》课程分析[J];淮北职业技术学院学报;2007年03期

中国重要会议论文全文数据库 前10条

1 吴建军;;谈网页设计的艺术性表现[A];经天纬地——全国测绘科技信息网中南分网第十九次学术交流会优秀论文选编[C];2005年

2 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

3 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

4 孙静;刘正捷;奚小玲;王慧;;帮助盲人理解网页信息的一种网页结构划分方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

5 曹淮;晁丁丁;;3D元素在网页信息传达中的应用研究[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年

6 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年

7 马骁;王晓龙;王轩;卜永忠;;基于网页信息结构的网页体裁聚类分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

8 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年

9 于满泉;谭松波;许洪波;;网页内部结构挖掘技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

10 王宇;黄炜;肖艳芹;任建立;李天柱;;ORBASE用于基于内容的Web查询[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

中国重要报纸全文数据库 前10条

1 本报记者 曾居仁 通讯员 郝金荣;贵州“万村千乡”网页工程开辟为农服务新渠道[N];中国气象报;2012年

2 壮壮;批量保存网页信息[N];电脑报;2004年

3 罗震宇 严小斌;一种新型WEB开发技术的探讨[N];中国冶金报;2011年

4 钱鹏;网尽Web页中的好东东[N];电脑报;2004年

5 星之海洋;迈出网页制作的第一步[N];电脑报;2004年

6 河南 张金贵;FrontPage2000组件详解(四)[N];电脑报;2001年

7 枫尔;网站浏览提速的五大秘方[N];中国证券报;2004年

8 飘零剑客;网络监控利器——AnyView[N];中国电脑教育报;2004年

9 八戒;眨眼之间 答案立现[N];电脑报;2013年

10 ;网络应用 天龙八“步” 申请上网账号[N];电脑报;2002年

中国博士学位论文全文数据库 前10条

1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年

2 龚昌盛;基于语义标注的网页广告加载模型研究[D];武汉大学;2010年

3 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年

4 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年

5 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年

6 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年

7 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年

8 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年

9 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年

10 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年

中国硕士学位论文全文数据库 前10条

1 敖志敏;基于网页相似度的搜索算法改进的研究[D];上海师范大学;2015年

2 杨寻;地域文化的视觉元素在旅游网页设计中的应用研究[D];西南交通大学;2015年

3 张W,

本文编号:1189129


资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/xuekejiaoyulunwen/1189129.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户10ab9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com