基于地理-社会-评论关系的典型化兴趣点推荐方法

发布时间:2021-07-03 16:05
  当前兴趣点推荐大多利用兴趣点的位置信息和用户的社交关系提升推荐质量,忽略了兴趣点评论信息的重要性;此外,推荐的兴趣点之间通常比较相似,不具有代表性和差异性.针对上述问题,提出了一种新的兴趣点相关度评估模型,称为地理-社会-评论关系模型,并给出了一种新的评论文本相似度度量方法.根据兴趣点间的地理-社会-评论关系相关度,提出了基于谱聚类的兴趣点聚类方法和基于概率密度估计的兴趣点典型化选取方法,以便从每个聚类中选取一个具有代表性的兴趣点.对于选取的典型化兴趣点,提出了利用概率因子模型拟合用户访问兴趣点次数矩阵的方法对推荐结果进行个性化排序.实验结果表明,本文提出的相关度评估模型对兴趣点的相关度评估更合理,推荐结果在多样性和准确率方面都取得了更好的效果. 

【文章来源】:小型微型计算机系统. 2019,40(11)北大核心CSCD

【文章页数】:8 页

【部分图文】:

基于地理-社会-评论关系的典型化兴趣点推荐方法


总体框架图Fig.1Generalframeworkdiagram

示意图,聚类,示意图,兴趣点


?2、θ3为可调参数,用于调整地理相关度、社会相关度、评论文本相关度在兴趣点相关度中的比重,其中θ1+θ2+θ3=1.5兴趣点的典型化选取5.1基于兴趣点相关度矩阵的聚类为了得到具有多样性的兴趣点推荐列表,需将第4节得到的兴趣点相关度矩阵进行聚类,进而从不同类别中选取典型性的兴趣点.谱聚类是一种基于图论的聚类方法,该算法只需要数据之间的相似度矩阵即可,并更适合在高维度的数据上运行,因此本文采用谱聚类中规范割集准则[22]进行兴趣点的聚类.图2是一个带权无向图,顶点之间的连线表示两个顶点之间的联系,边的权重代表顶点的相关度,本文用wij代表顶点i与j之间的相关度.假设图2的无向图被分为两类G1和G2,以n维向量(这里n=7)q=[q1,q2,…,qn]记录该无向图的划分方法(若顶点i属于G1,则qi=c1;若顶点i属于G2,则qi=c2),划分方案可表示为q=[c1,c1,c1,c1,c2,c2,c2].按此划分方案,划分最优子图时所截断的兴趣点关系图中边的权重之和的函数,即损失函数可表示为:Cut(G1,G2)=∑i∈G1,j∈G2wij=∑ni=1∑nj=1wij(qi-qj)22(c1-c2)2(17)图2谱聚类示意图Fig.2Spectralclusteringdiagram又因为:∑ni=1∑nj=1wij(qi-qj)2=∑ni=1∑nj=1wij(q2i-2qiqj+q2j)=-∑ni=1∑nj=12wijqiqj+∑ni=1∑n

评论文,重叠率,准确率,相关度


疚奶?出的方法和ST-CW算法[26]分别将该基准文本与其余30组评论文本做相似度计算,并整理出与该基准评论文本相似度最高的10组评论.然后邀请了10个用户(硕士生),让他们从30组评论中选出与基准文本最相似的10组评论文本.则算法的准确率为:Accuracy=|AR∩UR|10(28)其中,分子代表由不同方法得到的10组评论文本和由用户选出的10组评论文本的交集,即两种方法得到的结果与用户标注结果之间的重叠程度,重叠程度越高,说明用户满意度(算法准确率)越高.图310名用户的满意程度Fig.3Satisfactionof10users从图3可以看出,本文提出的算法的重叠率为82%,而ST-CW算法的重叠率为69%(重叠率取10个用户的平均值).由此可见,本文提出的算法具有较高的重叠率,即具有较高的准确率.6.4推荐结果分析实验中,以0.1为步长,采用枚举法讨论兴趣点相关度的权重系数.首先令θ1=0.1,分别令θ2=0.1、0.2、…、0.8,θ3=0.8、0.7、…、0.1,然后令θ1=0.2,分别令θ2=0.1、0.2、…、0.7,θ3=0.7、0.6、…、0.1,再令θ1=0.3,分别令θ2=0.1、0.2、…、0.6,θ3=0.6、0.5、…、0.1,以此类推.经测得,当θ1=0.8、θ2=0.1、θ3=0.1时在准确率召回率指标上取得较好的结果,因此选取0.8、0.1、0.1作为地理相关度、社会相关度以及评论相关度的权重系数;而PFM中的参数根据文献[23]中的最优参数设定,αk=20、βk=0.2,该参数经过测试,同样适用于本文所用数据集;在k-means聚类中,本

【参考文献】:
期刊论文
[1]融合地理-社会关系的空间聚类方法[J]. 唐延欢,孟祥福,张霄雁,毕崇春,唐晓亮.  小型微型计算机系统. 2017(11)
[2]基于用户的协同过滤算法的推荐效率和个性化改进[J]. 王成,朱志刚,张玉侠,苏芳芳.  小型微型计算机系统. 2016(03)
[3]面向微博系统的实时个性化推荐[J]. 高明,金澈清,钱卫宁,王晓玲,周傲英.  计算机学报. 2014(04)
[4]一种基于LDA的社区问答问句相似度计算方法[J]. 熊大平,王健,林鸿飞.  中文信息学报. 2012(05)
[5]结合词义的文本特征词权重计算方法[J]. 李明涛,罗军勇,尹美娟,路林.  计算机应用. 2012(05)
[6]一种基于WordNet的短文本语义相似性算法[J]. 翟延冬,王康平,张东娜,黄岚,周春光.  电子学报. 2012(03)
[7]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉.  计算机学报. 2011(05)
[8]基于常问问题集的中文问答系统研究[J]. 秦兵,刘挺,王洋,郑实福,李生.  哈尔滨工业大学学报. 2003(10)



本文编号:3262905

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3262905.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8292***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com