基于加权Word2vec融合多维信息的IOS APP按需推荐研究
发布时间:2021-07-08 07:39
在大数据和移动计算背景下,国内外的手机应用商城推出的APP层出不穷,智能PC设备已经成为人们生活中不可或缺的一部分,各种APP软件应运而生,在各类APP的推广中,如何准确的为用户推荐合适的APP使其下载是一个极具挑战性的问题,吸引了国内外研究人员的广泛关注。但是,已有的研究方法大都基于单一APP信息进行推荐,忽略了能够体现出APP热度的多维信息。因此,本文针对IOS手机用户,深入研究如何基于APP多维信息进行高质量的APP推荐,主要研究内容如下:(1)提出了一种基于加权Word2vec的相似APP推荐方法。该方法针对APP Store中与用户需求并无关联的APP出现在搜索推荐列表中的问题,首先利用爬虫软件对七麦数据网的APP信息进行收集,并对收集的信息进行预处理,然后利用TF-IDF(Term Frequency-Inverse Document frequency,词频-逆文档频率)算法从APP描述信息中提取特征词,进而采用Word2vec工具对APP描述信息提取的特征词进行向量化。使用类似的方法对用户需求文本进行向量化操作,采用余弦相似度计算方法进行相似度计算排序,选取与用户需求文...
【文章来源】:河南大学河南省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
基于加权Word2vec融合多维信息的IOSAPP按需推荐框架
实闹匾?浴F渌惴ㄋ枷胧峭ü?统计某个单词在其他单词之后出现的次数以及该单词是否出现在权重较高的单词之后,经过不停的迭代,能够提取出一个文档的特征词。TextRank算法与TF-IDF算法不同的是,TF-IDF算法需要许多不同的文档才能够提取出一篇文档的特征词,而TextRank算法仅仅需要一篇文档就能够提取出特征词。TextRank的算法的原理如图2-1所示,假设W1、W2、W3和W4是一篇文章中出现的四个单词,W1、W2和W3的后面都出现了W4,则相应的W4的权重就会很高。或者说W1、W2和W3的权重很高的话,那么W4的权重值也会相应的提高。图2-1TextRank算法原理示意图2.2长短时记忆网络长短时记忆网络(LSTM)是循环神经网络(RNN)的一个进阶版本,由Hochreiter
τ贸【爸饕??ㄒ韵铝椒矫妫海?)对于文本的处理;(2)与时序相关的应用场景。从其应用场景来看,无论是应用于哪一种应用场景,都有一个共同点,就是所处理的内容都是有先后顺序的。比如对于文本的情感分析处理,一句话中的内容先后顺序是不能改变的,如果内容的先后顺序改变了,其情感极性也有可能随之改变。再比如与时序相关的应用场景,经典的场景就是利用LSTM来预测股票的走势,每一天的走势是不能随意变换位置的,否则含义就变了。LSTM由于其独特的结构使得其对于长期依赖的问题有良好的表现,其结构如图2-2所示:图2-2LSTM结构图从图中我们可以看出,LSTM处理信息的流程可以分为三个部分。第一部分决定哪些信息需要被遗忘,通过Sigmoid函数的输出值,我们可以判断在上一个状态中的信息有多少可以被遗忘。第二部分决定添加哪些新的信息,该部分分为两个步骤,第一步是将新的信息通过Sigmoid函数决定有多少新的信息能够添加,第二步是tanh层根据现在的输入与上一层的输出生成一个新的状态。第三部分为信息的选择性输出,计算出Sigmoid门的输出与tanh处理后的细胞状态相乘得到最终的输出结果。而图中的水平线是该网络结构的关键,它贯穿整个链条。LSTM能够很好的处理与时序有关问题的关键就在于“门”的存在,以一个简单的情感极性分析为例,如图2-3所示:
【参考文献】:
期刊论文
[1]融合用户信任和影响力的top-N推荐算法[J]. 张雪峰,陈秀莉,僧德文. 浙江大学学报(工学版). 2020(02)
[2]基于信息熵加权的Word2vec中文文本分类研究[J]. 吴萍萍. 长春师范大学学报. 2020(02)
[3]基于编码解码器与深度主题特征抽取的多标签文本分类[J]. 陈文实,刘心惠,鲁明羽. 南京师大学报(自然科学版). 2019(04)
[4]一种基于深度学习的中文文本特征提取与分类方法[J]. 曹鲁慧,邓玉香,陈通,李钊. 山东科学. 2019(06)
[5]基于深度学习的APP-Store评论情感分析[J]. 李鑫,李晓戈. 计算机与数字工程. 2019(10)
[6]基于位置的个性化关键词查询推荐[J]. 梁耀培,吴定明. 深圳大学学报(理工版). 2019(04)
[7]融合主题模型和卷积神经网络的APP推荐研究[J]. 王杰,唐菁荟,王昊,邓三鸿. 情报理论与实践. 2019(04)
[8]面向移动APP的个性化推荐算法[J]. 尚燕飞,陈德运,杨海陆. 哈尔滨理工大学学报. 2018(06)
[9]基于社交网络信任关系的服务推荐方法[J]. 王佳蕾,郭耀,刘志宏. 计算机科学. 2018(S2)
[10]基于APP搜索系统的PageRank改进算法[J]. 李春生,刘小刚,焦海涛,张可佳. 计算机与现代化. 2018(07)
博士论文
[1]搜索引擎中的实体推荐关键技术研究[D]. 黄际洲.哈尔滨工业大学 2019
硕士论文
[1]基于潜在共现的推荐算法研究及其应用[D]. 王恩慧.山西大学 2019
[2]基于Spark的网络数据分析系统研究与实现[D]. 郑文辉.华中科技大学 2019
[3]新傣文手写体字符识别算法比较研究[D]. 张立欣.云南大学 2018
[4]基于权限和功能的APP个性化推荐算法的研究[D]. 曾观音.武汉大学 2017
[5]基于文本分析的情感挖掘模型研究与应用[D]. 程强.电子科技大学 2017
[6]网商用户评论中错别字自动检测与纠正的研究及实现[D]. 徐梦瑶.北京工业大学 2016
[7]基于Hadoop架构的商业推荐引擎协同过滤算法设计与实现[D]. 周恒新.电子科技大学 2016
[8]具有语义搜索推荐功能的交互式专业主页系统设计与实现[D]. 王爽.北京邮电大学 2015
本文编号:3271155
【文章来源】:河南大学河南省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
基于加权Word2vec融合多维信息的IOSAPP按需推荐框架
实闹匾?浴F渌惴ㄋ枷胧峭ü?统计某个单词在其他单词之后出现的次数以及该单词是否出现在权重较高的单词之后,经过不停的迭代,能够提取出一个文档的特征词。TextRank算法与TF-IDF算法不同的是,TF-IDF算法需要许多不同的文档才能够提取出一篇文档的特征词,而TextRank算法仅仅需要一篇文档就能够提取出特征词。TextRank的算法的原理如图2-1所示,假设W1、W2、W3和W4是一篇文章中出现的四个单词,W1、W2和W3的后面都出现了W4,则相应的W4的权重就会很高。或者说W1、W2和W3的权重很高的话,那么W4的权重值也会相应的提高。图2-1TextRank算法原理示意图2.2长短时记忆网络长短时记忆网络(LSTM)是循环神经网络(RNN)的一个进阶版本,由Hochreiter
τ贸【爸饕??ㄒ韵铝椒矫妫海?)对于文本的处理;(2)与时序相关的应用场景。从其应用场景来看,无论是应用于哪一种应用场景,都有一个共同点,就是所处理的内容都是有先后顺序的。比如对于文本的情感分析处理,一句话中的内容先后顺序是不能改变的,如果内容的先后顺序改变了,其情感极性也有可能随之改变。再比如与时序相关的应用场景,经典的场景就是利用LSTM来预测股票的走势,每一天的走势是不能随意变换位置的,否则含义就变了。LSTM由于其独特的结构使得其对于长期依赖的问题有良好的表现,其结构如图2-2所示:图2-2LSTM结构图从图中我们可以看出,LSTM处理信息的流程可以分为三个部分。第一部分决定哪些信息需要被遗忘,通过Sigmoid函数的输出值,我们可以判断在上一个状态中的信息有多少可以被遗忘。第二部分决定添加哪些新的信息,该部分分为两个步骤,第一步是将新的信息通过Sigmoid函数决定有多少新的信息能够添加,第二步是tanh层根据现在的输入与上一层的输出生成一个新的状态。第三部分为信息的选择性输出,计算出Sigmoid门的输出与tanh处理后的细胞状态相乘得到最终的输出结果。而图中的水平线是该网络结构的关键,它贯穿整个链条。LSTM能够很好的处理与时序有关问题的关键就在于“门”的存在,以一个简单的情感极性分析为例,如图2-3所示:
【参考文献】:
期刊论文
[1]融合用户信任和影响力的top-N推荐算法[J]. 张雪峰,陈秀莉,僧德文. 浙江大学学报(工学版). 2020(02)
[2]基于信息熵加权的Word2vec中文文本分类研究[J]. 吴萍萍. 长春师范大学学报. 2020(02)
[3]基于编码解码器与深度主题特征抽取的多标签文本分类[J]. 陈文实,刘心惠,鲁明羽. 南京师大学报(自然科学版). 2019(04)
[4]一种基于深度学习的中文文本特征提取与分类方法[J]. 曹鲁慧,邓玉香,陈通,李钊. 山东科学. 2019(06)
[5]基于深度学习的APP-Store评论情感分析[J]. 李鑫,李晓戈. 计算机与数字工程. 2019(10)
[6]基于位置的个性化关键词查询推荐[J]. 梁耀培,吴定明. 深圳大学学报(理工版). 2019(04)
[7]融合主题模型和卷积神经网络的APP推荐研究[J]. 王杰,唐菁荟,王昊,邓三鸿. 情报理论与实践. 2019(04)
[8]面向移动APP的个性化推荐算法[J]. 尚燕飞,陈德运,杨海陆. 哈尔滨理工大学学报. 2018(06)
[9]基于社交网络信任关系的服务推荐方法[J]. 王佳蕾,郭耀,刘志宏. 计算机科学. 2018(S2)
[10]基于APP搜索系统的PageRank改进算法[J]. 李春生,刘小刚,焦海涛,张可佳. 计算机与现代化. 2018(07)
博士论文
[1]搜索引擎中的实体推荐关键技术研究[D]. 黄际洲.哈尔滨工业大学 2019
硕士论文
[1]基于潜在共现的推荐算法研究及其应用[D]. 王恩慧.山西大学 2019
[2]基于Spark的网络数据分析系统研究与实现[D]. 郑文辉.华中科技大学 2019
[3]新傣文手写体字符识别算法比较研究[D]. 张立欣.云南大学 2018
[4]基于权限和功能的APP个性化推荐算法的研究[D]. 曾观音.武汉大学 2017
[5]基于文本分析的情感挖掘模型研究与应用[D]. 程强.电子科技大学 2017
[6]网商用户评论中错别字自动检测与纠正的研究及实现[D]. 徐梦瑶.北京工业大学 2016
[7]基于Hadoop架构的商业推荐引擎协同过滤算法设计与实现[D]. 周恒新.电子科技大学 2016
[8]具有语义搜索推荐功能的交互式专业主页系统设计与实现[D]. 王爽.北京邮电大学 2015
本文编号:3271155
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3271155.html