基于URL分类技术的IT员工工作效率分析系统设计与实现
发布时间:2021-03-07 19:10
随着网络互联网的快速发展,给我们的生活带来了许多便利,IT行业从业者用自己的智慧与汗水,给互联网的发展添加动力。由于IT类岗位工作繁重,IT行业的加班已成常态,由此引发的工作效率下降问题日益严重,甚至出现了“无效加班”的现象。工作效率的量化对企业与员工本身都颇有益处,可以帮助员工自身进行工作的合理安排,提升工作效率,拒绝无效加班,可以帮助企业进行合理的团队效能提升和人员优化等。员工工作效率分析系统,结合自然语言处理技术,分析在员工工作电脑上采集到的工作行为数据,进行工作效率的分析。工作效率的分析数据来源主要是:员工进程的使用情况,浏览器URL访问情况和电脑工作时长。系统中涉及到了URL分类技术,web网页正文抽取技术,中文文本分类技术。Web网页正文抽取技术在系统中用来对URL链接的网页正文进行抽取,方法使用了基于扩展文本块密度的正文抽取算法,在对抽取后的文本进行文本分类操作时,使用的方法是:由word2vec技术构建词向量,LSTM算法作为分类模型。
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
网页内容抽取算法CETBD
合人类分析文本的过程。的计算都与时刻参数 t 有关,隐含层会将 t 时刻从输入层得与 t-1 时刻的隐含层传入的数值进行求和,得到 t 时刻隐藏络的结构图如图 2.2 所示。
LSTM结构
【参考文献】:
期刊论文
[1]基于改进的n-gram模型的URL分类算法研究[J]. 骆聪,周城. 计算机技术与发展. 2018(09)
[2]基于深度学习的文本分类研究进展[J]. 刘婷婷,朱文东,刘广一. 电力信息与通信技术. 2018(03)
[3]自然语言处理中的深度学习:方法及应用[J]. 林奕欧,雷航,李晓瑜,吴佳. 电子科技大学学报. 2017(06)
[4]基于文本块密度和标签路径覆盖率的网页正文抽取[J]. 刘鹏程,胡骏,吴共庆. 计算机应用研究. 2018(06)
[5]基于递归神经网络的文本分类研究[J]. 黄磊,杜昌顺. 北京化工大学学报(自然科学版). 2017(01)
[6]基于Word2vec的微博短文本分类研究[J]. 张谦,高章敏,刘嘉勇. 信息网络安全. 2017(01)
[7]基于长短期记忆神经网络的短期负荷预测方法[J]. 刘桐彤. 黑龙江科技信息. 2016(31)
[8]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[9]基于word2vec的关键词提取算法[J]. 李跃鹏,金翠,及俊川. 科研信息化技术与应用. 2015(04)
[10]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
硕士论文
[1]基于深度学习的文本分类技术的研究[D]. 庞丹丹.北方工业大学 2018
[2]基于向量空间模型的文本内容筛查方法研究[D]. 蔡礼高.电子科技大学 2018
[3]基于URL分类技术的垃圾邮件过滤系统的分析与设计[D]. 邢文钊.北京邮电大学 2013
本文编号:3069651
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
网页内容抽取算法CETBD
合人类分析文本的过程。的计算都与时刻参数 t 有关,隐含层会将 t 时刻从输入层得与 t-1 时刻的隐含层传入的数值进行求和,得到 t 时刻隐藏络的结构图如图 2.2 所示。
LSTM结构
【参考文献】:
期刊论文
[1]基于改进的n-gram模型的URL分类算法研究[J]. 骆聪,周城. 计算机技术与发展. 2018(09)
[2]基于深度学习的文本分类研究进展[J]. 刘婷婷,朱文东,刘广一. 电力信息与通信技术. 2018(03)
[3]自然语言处理中的深度学习:方法及应用[J]. 林奕欧,雷航,李晓瑜,吴佳. 电子科技大学学报. 2017(06)
[4]基于文本块密度和标签路径覆盖率的网页正文抽取[J]. 刘鹏程,胡骏,吴共庆. 计算机应用研究. 2018(06)
[5]基于递归神经网络的文本分类研究[J]. 黄磊,杜昌顺. 北京化工大学学报(自然科学版). 2017(01)
[6]基于Word2vec的微博短文本分类研究[J]. 张谦,高章敏,刘嘉勇. 信息网络安全. 2017(01)
[7]基于长短期记忆神经网络的短期负荷预测方法[J]. 刘桐彤. 黑龙江科技信息. 2016(31)
[8]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[9]基于word2vec的关键词提取算法[J]. 李跃鹏,金翠,及俊川. 科研信息化技术与应用. 2015(04)
[10]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
硕士论文
[1]基于深度学习的文本分类技术的研究[D]. 庞丹丹.北方工业大学 2018
[2]基于向量空间模型的文本内容筛查方法研究[D]. 蔡礼高.电子科技大学 2018
[3]基于URL分类技术的垃圾邮件过滤系统的分析与设计[D]. 邢文钊.北京邮电大学 2013
本文编号:3069651
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3069651.html