深度学习在社交网络文本分类中的应用研究
发布时间:2020-12-11 11:50
近年来,伴随着互联网产业的迅猛发展,计算机硬件端的普及,尤其是智能手机的流行,让移动互联网端的产业井喷式发展,移动流量资费的下降,WiFi等硬件设施的覆盖,使得网民数量呈几何倍数式上升,网民年龄段基本涵盖了从小学生到青年中年老年人的全段式人群。淘宝、京东以及国外的亚马逊等电商购物平台的兴起,以微博、微信、以及国外的Twitter、Facebook等社交网络平台为代表的互联网社交产品也流传广泛。随着越来越多的活跃用户不断地更新自己的状态,每时每刻都有大量的文本数据发布在这些社交平台上,例如发布自己的状态,评价商品或事件,包括聊天记录等信息,这些海量的文本数据如何准确高效地提取出有价值的信息,无论是对于互联网服务提供商、科研院所还是政府事业单位来说,文本分类技术应该如何正确而高效地应用,从庞大数量的网络文本数据中提取并返回更加精准、简洁的信息,是迫切需要解决的问题。深度学习的相关理论在2006年被提出后,经过研究人员不断的完善,其在图像、语音识别等领域中,取得了丰硕的研究成果。随后逐渐有研究人员尝试在文本分类中应用深度学习,利用可自我学习特性,解决了对文本分类中自然语言理解可行性的问题;利...
【文章来源】:大连交通大学辽宁省
【文章页数】:58 页
【学位级别】:硕士
【图文】:
图2.1深度学习核心思想??Fig?2.1?deep?learning?core?idea??
新查询进行检索时运用普通的向量空间模型。在不关联文档的向量被减去之后,向??量空间之中的正值分量将被保留。Rocchio中,如果权重分量为负值,此分量就没有了??价值,将被忽略,即此〇作为分量权重。Rocchio应用于关联反馈的场景如下图2.4所??7Jn?〇??11??
〇相关文档???不相关文档??图2.4查询示意图??Fig?2.4?Query?diagram??在实际中的信息检索应用场景里,如果有一个有关于用户的查询,而且在开始时知道部??分关联文档与不关联文档的相关信息,于是查询向量q经过修改之后可以表示为公式??(2.3):??=a^〇?+?^T77|?^?dj ̄y\Pr ̄\Yj?dj?(2.3)??\Ur\?d^C,?|?djeCr??q代表初始的查询向量,Dnr与Dr二者代表己知的关联文档集合与不关联文档集合。??a、P和丫代表q、Dr与Diir的权承:。a、P和y能通过如下方式调节判定结果与初始??查询向量二者的平衡:若已判断的文档己经大部分存在,就可以将较高的权重赋予P??和Y。新查询在修改后由%开始,往关联文档的质心向量缩短一段距离,于此同时,又??远离了不关联文档的质心向量。??新查询进行检索时运用普通的向量空间模型。在不关联文档的向量被减去之后,向??量空间之中的正值分量将被保留。Rocchio中
【参考文献】:
期刊论文
[1]一种面向文本分类的特征向量优化方法[J]. 郭正斌,张仰森,蒋玉茹. 计算机应用研究. 2017(08)
[2]基于SVM的在线商品评论的情感倾向性分析[J]. 肖江,王晓进. 信息技术. 2016(07)
[3]基于深度信念网络的文本分类算法[J]. 陈翠平. 计算机系统应用. 2015(02)
[4]基于深度学习的微博情感分析[J]. 梁军,柴玉梅,原慧斌,昝红英,刘铭. 中文信息学报. 2014(05)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[6]SVM文本分类中一种新的特征提取方法[J]. 姜鹤,陈丽亚. 计算机技术与发展. 2010(03)
[7]一种基于特征重要度的文本分类特征加权方法[J]. 刘赫,刘大有,裴志利,高滢. 计算机研究与发展. 2009(10)
[8]基于向量空间模型中义项词语的无导词义消歧[J]. 鲁松,白硕,黄雄. 软件学报. 2002(06)
硕士论文
[1]基于位置和语义特征的中文命名实体关系抽取研究[D]. 李海光.合肥工业大学 2011
本文编号:2910474
【文章来源】:大连交通大学辽宁省
【文章页数】:58 页
【学位级别】:硕士
【图文】:
图2.1深度学习核心思想??Fig?2.1?deep?learning?core?idea??
新查询进行检索时运用普通的向量空间模型。在不关联文档的向量被减去之后,向??量空间之中的正值分量将被保留。Rocchio中,如果权重分量为负值,此分量就没有了??价值,将被忽略,即此〇作为分量权重。Rocchio应用于关联反馈的场景如下图2.4所??7Jn?〇??11??
〇相关文档???不相关文档??图2.4查询示意图??Fig?2.4?Query?diagram??在实际中的信息检索应用场景里,如果有一个有关于用户的查询,而且在开始时知道部??分关联文档与不关联文档的相关信息,于是查询向量q经过修改之后可以表示为公式??(2.3):??=a^〇?+?^T77|?^?dj ̄y\Pr ̄\Yj?dj?(2.3)??\Ur\?d^C,?|?djeCr??q代表初始的查询向量,Dnr与Dr二者代表己知的关联文档集合与不关联文档集合。??a、P和丫代表q、Dr与Diir的权承:。a、P和y能通过如下方式调节判定结果与初始??查询向量二者的平衡:若已判断的文档己经大部分存在,就可以将较高的权重赋予P??和Y。新查询在修改后由%开始,往关联文档的质心向量缩短一段距离,于此同时,又??远离了不关联文档的质心向量。??新查询进行检索时运用普通的向量空间模型。在不关联文档的向量被减去之后,向??量空间之中的正值分量将被保留。Rocchio中
【参考文献】:
期刊论文
[1]一种面向文本分类的特征向量优化方法[J]. 郭正斌,张仰森,蒋玉茹. 计算机应用研究. 2017(08)
[2]基于SVM的在线商品评论的情感倾向性分析[J]. 肖江,王晓进. 信息技术. 2016(07)
[3]基于深度信念网络的文本分类算法[J]. 陈翠平. 计算机系统应用. 2015(02)
[4]基于深度学习的微博情感分析[J]. 梁军,柴玉梅,原慧斌,昝红英,刘铭. 中文信息学报. 2014(05)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[6]SVM文本分类中一种新的特征提取方法[J]. 姜鹤,陈丽亚. 计算机技术与发展. 2010(03)
[7]一种基于特征重要度的文本分类特征加权方法[J]. 刘赫,刘大有,裴志利,高滢. 计算机研究与发展. 2009(10)
[8]基于向量空间模型中义项词语的无导词义消歧[J]. 鲁松,白硕,黄雄. 软件学报. 2002(06)
硕士论文
[1]基于位置和语义特征的中文命名实体关系抽取研究[D]. 李海光.合肥工业大学 2011
本文编号:2910474
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2910474.html