网页文本分类及其在搜索引擎中的应用.pdf.pdf
发布时间:2016-06-30 20:02
本文关键词:网页文本分类及其在搜索引擎中的应用,,由笔耕文化传播整理发布。
文档介绍:
北京工业大学硕士学位论文网页文本分类及其在搜索引擎中的应用姓名:徐学可申请学位级别:硕士专业:计算机软件与理论指导教师:蒋宗礼20080401知识水坝论文摘要皇!——m.—— i!!!!曼!皇曼曼!鼍曼!!曼皇!手陶斐网页自动文本分类是处理和组织大规模网络文本信息的关键技术,是使信息资源得以合理有效组织的重要方法,同时也是解决主题搜索、个性化信息检索、搜索引擎的目录导航、信息过滤中相关问题的核心技术。研究网页自动文本分类对于解决人们如何有效获取有效网络信息,研究新一代搜索引擎有着重要意义。本文研究了网页文本分类及其在搜索引擎应用,主要工作如下:1. 网页文本分类相关技术的研究:包括特征选择,特征抽取,分类算法,网页处理等,在此基础上设计并实现一个网页文本分类子系统,对网页分类各种技术进行整合,使其具有良好的框架和可扩展性。2. 提出了~种基于集成学习与类指示器的文本分类方法,该方法利用AdaBoost.MH算法框架,在每一轮次中,自适应地计算类指示器,通过加权组合所有成员类指示器,获得对理想类指示器的一种逼近。利用最终的类指示器所得到的分类器不仅简单易于更新,而且泛化能力强。3. 将集成学习方法与推拉策略结合来修正中心法的分类器偏差,基于AdaBoost.MR方...
内容来自转载请标明出处.
本文关键词:网页文本分类及其在搜索引擎中的应用,由笔耕文化传播整理发布。
本文编号:64065
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/64065.html