基于规则的网页分割预处理算法研究
[Abstract]:Aiming at the problem that the content and style of web pages are designed independently and the algorithm of page segmentation is difficult to run, a preprocessing algorithm for web page segmentation based on rules is proposed, and the association between page labels and style information is established. The algorithm consists of three steps: first, obtaining style information; second, associating style information and tags; third, outputting lists of HTML and PerfectNode association classes. A preprocessing algorithm for web pages running on 100 national excellent course websites is randomly selected. The experimental results show that the algorithm can effectively fuse the page label and style information and solve the problem that the page segmentation algorithm can not run.
【作者单位】: 华中师范大学信息与新闻传播学院;湖北大学教育学院;
【基金】:教育部人文社科基金项目:移动学习服务适配决策技术及优化策略研究(10YJC880113) 国家科技支撑计划课题:全媒体在线编辑与适配推送数字出版技术研究及应用示范(2013BAH30F01) 中央高校基本科研业务费项目:泛在多媒体服务中内容适配决策模型及优化研究,中央高校基本科研业务费项目:数字化学习环境及工具的典型应用(CCNU10C01003)资助
【分类号】:TP393.092
【共引文献】
相关期刊论文 前3条
1 宋凯;严丽平;甘岚;;嵌入式Web服务器的设计与实现[J];计算机工程与设计;2009年04期
2 严丽平;宋凯;甘岚;;Genie Shell for uC/OS-Ⅱ的设计与实现[J];计算机工程与设计;2009年06期
3 程京;邓钦文;王璇;;一种基于ARM9的智能水位监测系统的设计[J];微计算机信息;2010年32期
相关硕士学位论文 前8条
1 陈长虹;油田网络视频监控系统的设计与实现[D];电子科技大学;2010年
2 吴雪琴;基于S3C2410远程监控系统的设计与实现[D];电子科技大学;2010年
3 张海东;基于互联网的远程视频监控终端设计[D];太原理工大学;2011年
4 唐伟;面向小家电的无线网关设计与实施[D];武汉理工大学;2009年
5 刘雅光;基于ARM的远程视频监控系统设计与实现[D];武汉理工大学;2009年
6 成小霞;基于ARM的通信电源监控系统的研究[D];武汉理工大学;2009年
7 郑杜鹃;基于ARM嵌入式的远程环境视频监控系统设计[D];武汉理工大学;2013年
8 宋成儒;基于Linux嵌入式的视频监控系统设计与应用[D];昆明理工大学;2013年
【相似文献】
相关期刊论文 前10条
1 段昕;马军;宋玲;;利用分块重要度进行中文网页分类的研究[J];山东大学学报(理学版);2006年03期
2 余小燕;陆全华;;一种欺骗网页检测判定算法[J];成都大学学报(自然科学版);2009年04期
3 张宏丽;吴承勇;王海凤;;基于XML/XSL与设备无关的Web服务研究[J];内蒙古大学学报(自然科学版);2006年02期
4 彭莹;;基于CSS技术在网页设计中的应用[J];硅谷;2009年08期
5 侯明燕;杨天奇;;基于网页分割的Web信息提取算法[J];微型机与应用;2011年05期
6 袁自海;;CSS在网页设计中的应用[J];电脑知识与技术;2008年08期
7 孙晓辉;刘建;王劲林;陈晓;;基于CSS的网页分割算法[J];微计算机应用;2008年09期
8 曹玖新;毛波;罗军舟;刘波;;基于嵌套EMD的钓鱼网页检测算法[J];计算机学报;2009年05期
9 尹建伟;张璇;尹瑛;董金祥;罗尚虎;;支持语义耦合的设备自适应网页布局算法[J];浙江大学学报(工学版);2009年09期
10 陈翰生;曾剑平;张世永;;一种基于位置信息的Web页面分割方法[J];计算机应用与软件;2009年07期
相关硕士学位论文 前4条
1 徐超;基于DOM的网页净化方法研究[D];中国石油大学;2009年
2 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
3 刘宇婷;基于Web日志挖掘的个性化服务研究与应用[D];北京理工大学;2010年
4 郑海祥;系统调用在主机入侵检测中的研究与应用[D];广东工业大学;2011年
,本文编号:2314707
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2314707.html