当前位置:主页 > 管理论文 > 移动网络论文 >

基于叠加编码的Web网页抓取路径损耗估计

发布时间:2017-09-18 18:24

  本文关键词:基于叠加编码的Web网页抓取路径损耗估计


  更多相关文章: Web网页 文本特征 抓取路径 数据挖掘


【摘要】:对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。
【作者单位】: 邢台广播电视大学;
【关键词】Web网页 文本特征 抓取路径 数据挖掘
【分类号】:TP393.092;TP391.1
【正文快照】: 0引言随着信息技术的快速发展,特别是互联网的应用及普及,网络信息存储呈爆炸式增加趋势。Web网页包含海量信息,需要对其进行文本数据挖掘和抓取,Web网页结构,层次复杂,更新频繁,个性特征强,主题信息受到各种信息的干扰,对其有效的抓取是实现文本信息特征索引和挖掘的关键。在

【参考文献】

中国期刊全文数据库 前3条

1 刘燕;;基于云计算信息处理系统体系结构设计[J];科技通报;2012年08期

2 饶翔;王怀民;陈振邦;周扬帆;蔡华;周琦;孙廷韬;;云计算系统中基于伴随状态追踪的故障检测机制[J];计算机学报;2012年05期

3 覃雄派;王会举;李芙蓉;李翠平;陈红;周p,

本文编号:877137


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/877137.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00ac3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com