当前位置:主页 > 科技论文 > 软件论文 >

基于数据挖掘的APP推荐内容的预测模型研究

发布时间:2021-04-09 01:11
  随着互联网的大范围普及和极速发展、移动智能终端的不断升级,APP不再是一个新鲜词汇,它已逐步渗透到了生活的各个方面,而也因为这些APP的普及所带来的便利,使用APP成为一种全新的生活习惯。因此在这个大环境下,市场上涌现出了各个方面可以满足不同需求的APP,但特定的用户群体是有限的,如何在这个市场里让你的产品一直被用户喜欢且有较高的忠诚度,其实是一场流量战役,是每个企业都在意的核心。对于市场上的互联网公司来说,用户即生命,如同国家之间的资源争夺一样,抢到了用户就是财富,因此提高内容运营的质量是企业必须考虑的问题。内容做的新颖,可以满足用户的心理诉求,这样的内容才是有用的,才是企业和用户都需要的有价值的产出,因此对内容的运营要更好地把握和管理,而数据挖掘中的预测模型就可以很好地满足需求。本文研究的主要目的是预测一篇内容是否会被用户所喜欢,也就是将APP推荐内容的预测看成了一个二分类的问题,因为数据量不是很庞大,选取了逻辑回归算法来建立预测模型,而在特征体系的选取问题上,选择了利用多元回归和迭代决策树二者相结合的方法进行。训练模型所用的数据来源于全球著名的社交平台Facebook提供的某化妆... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:51 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘的APP推荐内容的预测模型研究


约朋友吃饭问题的决策树

曲线,曲线,逻辑函数,预测变量


第 3 章 APP 推荐内容的预测模型的构建预测变量。因为是二分类问题,所以假设用 1 表示正类,用 0 表示负的取值非 1 即 0。假设样本特征向量为 m 维,那么整个样本 x 最后判定的“概率”可以表示为: wxwxwxPyx1exp*11exp*exp*1| ,这称之为逻辑函数(sigmoid 函数),其中mwx w wx wx ... wx01111目的就是通过一定的方法得出这一组权值。逻辑函数的曲线如下图:

重要性排序


第 4 章 预测模型的实证分析和评价 方说明了方程的拟合程度,越多说明拟合程度越好,那么选中的这很好地解释最后的因变量,说明会对最后的结果产生较大的影响。分析,最后分析得到 Content_length(帖子长度)、Post_mouth(Engaged_users(预定用户)、Type(内容类型)等的七个特征变量释因变量。后进行特征重要性分析,第三章已经提到,本文使用 GBDT 的方特征的重要性。经过算法计算,得到了特征的重要性排序,通过交,按照固定间隔百分比筛选特征,并作图展示性能随特征筛选比例到性能最好的筛选比例是 91%,也就是 15 个特征的组合会使得预。


本文编号:3126620

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3126620.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a2c43***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com