当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的网页分类技术研究

发布时间:2022-07-12 17:42
  随着计算机技术的迅猛发展,互联网因其包含的海量信息而越来越多的成为了人们获取信息的主要场所。也有了更多的人乐于在互联网上分享自己的知识,这导致了网页数量的爆炸式增长。据1月31日中国互联网络信息中心(CNNIC)在京发布的第41次《中国互联网络发展状况统计报告》显示,截止至2017年12月,我国网民数量已经达到了7.72亿,占人口总数的55.8%,超过全球平均水准4.1个百分点,超过亚洲平均水准9.1个百分点。种种现象表明,互联网已经成为当代人们生活中必不可少的组成部分。而伴随着互联网的飞速发展,网络内容得到了极大的丰富。如何将这些海量的信息进行一个合理的筛选,让人们能快速,有效的找到自己想要的资源成为了一个重要而且有意义的问题。为了应对这种问题,人们发明了搜索引擎,能准确地查找人们所需要的信息,但将所有网页放在同一集合查找显然不是明智之举。调查显示,人们在进行信息检索时往往会围绕着一个主题。如果能将网页按页面类型进行分类将有效的提高信息检索的效率。将网页快速、有效的进行分类还能很好的提高搜索引擎对人们发出的信息检索请求的响应速度。目前在工业上网页分类多半是采用人工策略或者传统机器学习... 

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 引言
    1.1 研究背景
    1.2 国内外研究现状
        1.2.1 网页分类
        1.2.2 基于CNN的文本特征提取
    1.3 研究内容
    1.4 章节安排
第2章 相关技术研究
    2.1 网页分类简介
    2.2 分类算法
    2.3 卷积神经网络
        2.3.1 网络概述
        2.3.2 经典网络结构介绍
        2.3.3 损失函数
        2.3.4 梯度下降
    2.4 本章小结
第3章 网页分类技术研究
    3.1 网页分类流程
    3.2 网页抓取与结构化
    3.3 网页特征向量转换
    3.4 网页特征提取
    3.5 网页分类
    3.6 本章小结
第4章 实验结果
    4.1 评估方法
        4.1.1 分类标准
        4.1.2 评估标准
    4.2 评估流程
    4.3 结果对比
    4.4 本章小结
第5章 总结与展望
    5.1 论文总结
    5.2 工作展望
致谢
参考文献


【参考文献】:
期刊论文
[1]第41次《中国互联网络发展状况统计报告》发布[J].   中国广播. 2018(03)
[2]不同池化模型的卷积神经网络学习性能研究[J]. 刘万军,梁雪剑,曲海成.  中国图象图形学报. 2016(09)
[3]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟.  计算机研究与发展. 2013(09)
[4]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)
[5]搜索引擎技术研究与发展[J]. 印鉴,陈忆群,张钢.  计算机工程. 2005(14)
[6]自然语言处理[J]. 陈肇雄,高庆狮.  计算机研究与发展. 1989(11)



本文编号:3659567

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3659567.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户110b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com