基于语义特征融合的深度学习网页分类研究
发布时间:2023-03-05 17:18
随着互联网技术的发展,各式各样的网站出现在网络空间环境中,为人们信息的获取提供了极大的便利,各式各样的网页数量随着网站数量的增加呈现指数性的增长趋势。面对数量巨大的网站资源的出现,如何提供一种高效、准确、合理的网页分类筛选方法,让需要的人找到自己所需的资源成为一个重要而且有意义的问题。文本分类是自然语言处理领域中的经典主题,而网页分类归根结底还是文本分类的问题。网页分类是互联网基础资源管理与组织中一个最基础的问题之一,在搜索引擎、网页篡改分析、恶意网站识别等互联网基础应用中发挥着不可替代的作用。传统的Web数据挖掘技术通常利用网页特征分析结合浅层次机器学习的方法进行网页分类,但是随着网页数据结构组织的复杂化,在非结构化网页数据中提取有效的特征变得越来越困难,传统的机器学习在网页分类的效果上已经很难取得突破性的发展。深度学习模型逐渐己经成为处理文本分类的主流技术,基于深度学习的分析模型来构建特征文本向量的方法可以准确表达文中的词义和语义信息,但是也易被稀疏性等问题困扰,出现分类效果不佳的问题。针对上述问题,本文提出了一种基于语义特征融合的深度学习网页分类模型,该模型使用了 TextCNN...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 网页分类的目的和意义
1.2 国内外研究现状综述
1.3 论文研究内容
1.4 论文结构
2 网页分类相关技术综述
2.1 文本预处理
2.2 关键词提取
2.3 文本表示方法
2.4 基于机器学习的文本处理方法
2.5 基于深度学习的文本处理方法
2.6 语义特征
2.7 本章小结
3 网页分类流程概述
3.1 网页分类的整体流程
3.2 网页数据爬取与结构化
3.3 网页数据分词与特征向量转换
3.4 本章小结
4 基于深度学习的网页文本分类
4.1 基于XLNet的网页分类
4.2 算法实验
4.3 本章小结
5 基于语义特征融合的深度学习网页分类
5.1 基于TextCNN与XLNet网络特征融合的网页分类模型
5.2 基于语义特征融合的深度学习网页分类模型
5.3 算法实验
5.4 本章小结
6 总结与展望
6.1 论文主要研究工作总结
6.2 今后研究工作展望
参考文献
作者简历
致谢
学位论文数据集
本文编号:3756610
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 网页分类的目的和意义
1.2 国内外研究现状综述
1.3 论文研究内容
1.4 论文结构
2 网页分类相关技术综述
2.1 文本预处理
2.2 关键词提取
2.3 文本表示方法
2.4 基于机器学习的文本处理方法
2.5 基于深度学习的文本处理方法
2.6 语义特征
2.7 本章小结
3 网页分类流程概述
3.1 网页分类的整体流程
3.2 网页数据爬取与结构化
3.3 网页数据分词与特征向量转换
3.4 本章小结
4 基于深度学习的网页文本分类
4.1 基于XLNet的网页分类
4.2 算法实验
4.3 本章小结
5 基于语义特征融合的深度学习网页分类
5.1 基于TextCNN与XLNet网络特征融合的网页分类模型
5.2 基于语义特征融合的深度学习网页分类模型
5.3 算法实验
5.4 本章小结
6 总结与展望
6.1 论文主要研究工作总结
6.2 今后研究工作展望
参考文献
作者简历
致谢
学位论文数据集
本文编号:3756610
本文链接:https://www.wllwen.com/tushudanganlunwen/3756610.html
教材专著