网页体裁自动识别研究
发布时间:2017-12-10 22:08
本文关键词:网页体裁自动识别研究
【摘要】:随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。
【作者单位】: 四川大学计算机学院;
【分类号】:TP393.092
【正文快照】: 0引言近年来,互联网中网页数量激增,中文网页数量呈指数级增长。庞大的网页数量使得搜索引擎的任务更加艰巨,很难从网页中准确快捷地筛选出用户需求的网页。人们搜索万维网通常有一个明确的概念:他们知道他们正在寻找,他们知道哪种形式[20]。前者涉及到找到文件的内容,后者介
【参考文献】
中国期刊全文数据库 前3条
1 孙建涛,沈抖,陆玉昌,石纯一;网页分类技术[J];清华大学学报(自然科学版);2004年01期
2 周茜,赵明生,扈e,
本文编号:1276056
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1276056.html