当前位置:主页 > 科技论文 > 搜索引擎论文 >

网页体裁自动识别研究

发布时间:2017-12-10 22:08

  本文关键词:网页体裁自动识别研究


  更多相关文章: 网页分类 网页体裁 特征选择 机器学习


【摘要】:随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。
【作者单位】: 四川大学计算机学院;
【分类号】:TP393.092
【正文快照】: 0引言近年来,互联网中网页数量激增,中文网页数量呈指数级增长。庞大的网页数量使得搜索引擎的任务更加艰巨,很难从网页中准确快捷地筛选出用户需求的网页。人们搜索万维网通常有一个明确的概念:他们知道他们正在寻找,他们知道哪种形式[20]。前者涉及到找到文件的内容,后者介

【参考文献】

中国期刊全文数据库 前3条

1 孙建涛,沈抖,陆玉昌,石纯一;网页分类技术[J];清华大学学报(自然科学版);2004年01期

2 周茜,赵明生,扈e,

本文编号:1276056


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1276056.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1dea8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com