融合情感标签与时空特征的餐厅推荐算法研究
发布时间:2021-08-11 06:24
随着电子商务的广泛应用和位置采集技术的不断成熟,越来越多的用户可以随时进行签到发表自己的观点和看法,因而产生了大量的签到数据,这些签到数据主要包括带有用户情感的评价文本,地理位置(经、纬度)、签到时间等信息,签到数据信息非常具有研究价值,可以通过分析签到信息特征更好地刻画用户兴趣模型。随着用户签到信息过载问题的出现,使得推荐技术的研究受到广泛的关注,有效的推荐算法不仅可以帮助用户发现新兴趣点,还可以帮助兴趣地点商家发掘更多的潜在客户,提高商家的利益。本论文针对大众点评网美食餐厅的签到信息作为研究对象,对真实的数据集进行一系列的统计处理,从情感、空间、时间等多角度挖掘用户行为的特征及规律,分析影响用户兴趣的重要因素,根据发现的签到特征进行餐厅推荐算法的深入研究。首先,进行了融入情感标签的协同过滤算法研究,对评论语句进行分词、词性标注等句法处理,按照句法路径从签到数据的评论信息中抽取带有评论者感情的情感标签,采用基于词典的情感分析方法,在充分考虑程度副词及否定词对情感极性的影响的基础上分析用户标签情感极性。利用用户—特征情感评分矩阵计算用户间相似度,找到最相似的K个用户,根据“最近邻居”获...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2.?2基于项目的协同过滤推荐过程??Fig.?2.2?Project-based?collaborative?filtering?recommendation?process??
?融合情感标签与时空特征的推荐算法研究???得到对应的URL,并且存储对应的URL到待爬取队列中,然后返回上一步,继续解析??新的URL,当完成整个网络的遍历或者达到系统设置的条件,停止。工作流程如图2.5??所示。??初始化配置信息??I??初始化待爬取队列??1??创建workder县城???????抓取队一中弹!??i?反爬处理:切换IP、??Fetcherk取页面|?丨離请求_??Y?Handler处理页面一?<<^3容为反爬^^^>—Y>将1:乩放回待抓取队列??;?|?N??Parser解析页面一容为目标^??解析并获取目标数据???I???将URL放到己爬取队列??丁?,??_?_?|解析并获取获取后续URL放入待爬取队列??C5D?—?I?—??存储解析的目标数据???^r-<Celayma?>J?N??图2.?5爬虫工作流程??Fig.?2.5?Reptile?workflow??控制器,解析器,资源库组成了?Web爬虫系统框架的主要过程,三者间互相配合,??协同完成爬虫工作。其中,控制器是中央部分,通过系统传递的URL链接分配线程,??然后调用线程启动爬虫来抓取网页。解析器的主要任务是进行网页信息的下载并通过过??滤、提取特定HTML标签和分析信息等一系列方式处理网页数据,是整个过程的主要??-12?-??
?大连海事大学硕士学位论文???37?t???36.9?????36.7?J?H????炜?36.6?—-—???一?一?????—??故?.‘??度?36.5???_?:-?V?/?.———??36.4??^——?????舞?*??36.3?i?;???36.2?n??—??參?參??36.1???——?一?一??113.4?113.9?114.4?114.9?115.4??经度??图4.?5签到数据集经纬度分布??Fig.4.5?Check-in?dataset?latitude?and?longitude?distribution??图4.6统计了用户签到的相邻位置间的距离与用户签到位置的概率的分布,从图中??能够看出,用户签到位置的概率与用户签到的相邻位置间的距离成反比,即相邻签到位??置的距离越近,那么用户签到该位置的槪率越大。??0.6????0.5?—\???0.4?\???\??率.\??0.2?-—A?——??〇1????0?10?20?30?40?50?60??距禽(km)??图4.?6用户相邻签到位置的距离分布??Fig.4.6?Distance?distribution?of?users'?adjacent?check-in?locations??-45?-??
【参考文献】:
期刊论文
[1]基于知网的词语语义相似度改进算法[J]. 李蕾,杨丽花. 计算机技术与发展. 2019(04)
[2]一种基于HowNet语义计算的综合特征词权重计算方法[J]. 孙丽莉,张小刚. 统计与决策. 2018(18)
[3]基于句法路径的中文评论细粒度情感分析[J]. 胡征,陈尔希,曾献辉,蔡一. 信息技术. 2018(09)
[4]基于依存句法的跨语言细粒度情感分析[J]. 唐晓波,刘一平. 情报理论与实践. 2018(06)
[5]基于用户兴趣的协同过滤推荐算法[J]. 宋晨晨,曲朝阳,任有学,刘耀伟,牛强,独健鸿. 民营科技. 2017(07)
[6]基于改进相似性度量的项目协同过滤推荐算法[J]. 于金明,孟军,吴秋峰. 计算机应用. 2017(05)
[7]基于多特征融合的微博主题情感挖掘[J]. 黄发良,冯时,王大玲,于戈. 计算机学报. 2017(04)
[8]基于知网与词林的词语语义相似度计算[J]. 朱新华,马润聪,孙柳,陈宏朝. 中文信息学报. 2016(04)
[9]基于时间感知的地点推荐算法[J]. 卢露. 计算机工程与科学. 2016(03)
[10]时间衰减制导的协同过滤相似性计算[J]. 李源鑫,肖如良,陈洪涛,赵婷,李宏恩. 计算机系统应用. 2013(11)
硕士论文
[1]基于深度特征提取的文本情感极性分类研究[D]. 田竹.山东大学 2017
[2]基于统计方法的中文短文本情感分析[D]. 卢兴.北京理工大学 2016
[3]基于位置服务的个性化推荐算法研究[D]. 林学钦.华南理工大学 2012
[4]基于语义的标签推荐系统关键问题研究[D]. 邓双义.华东师范大学 2010
本文编号:3335637
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
图2.?2基于项目的协同过滤推荐过程??Fig.?2.2?Project-based?collaborative?filtering?recommendation?process??
?融合情感标签与时空特征的推荐算法研究???得到对应的URL,并且存储对应的URL到待爬取队列中,然后返回上一步,继续解析??新的URL,当完成整个网络的遍历或者达到系统设置的条件,停止。工作流程如图2.5??所示。??初始化配置信息??I??初始化待爬取队列??1??创建workder县城???????抓取队一中弹!??i?反爬处理:切换IP、??Fetcherk取页面|?丨離请求_??Y?Handler处理页面一?<<^3容为反爬^^^>—Y>将1:乩放回待抓取队列??;?|?N??Parser解析页面一容为目标^??解析并获取目标数据???I???将URL放到己爬取队列??丁?,??_?_?|解析并获取获取后续URL放入待爬取队列??C5D?—?I?—??存储解析的目标数据???^r-<Celayma?>J?N??图2.?5爬虫工作流程??Fig.?2.5?Reptile?workflow??控制器,解析器,资源库组成了?Web爬虫系统框架的主要过程,三者间互相配合,??协同完成爬虫工作。其中,控制器是中央部分,通过系统传递的URL链接分配线程,??然后调用线程启动爬虫来抓取网页。解析器的主要任务是进行网页信息的下载并通过过??滤、提取特定HTML标签和分析信息等一系列方式处理网页数据,是整个过程的主要??-12?-??
?大连海事大学硕士学位论文???37?t???36.9?????36.7?J?H????炜?36.6?—-—???一?一?????—??故?.‘??度?36.5???_?:-?V?/?.———??36.4??^——?????舞?*??36.3?i?;???36.2?n??—??參?參??36.1???——?一?一??113.4?113.9?114.4?114.9?115.4??经度??图4.?5签到数据集经纬度分布??Fig.4.5?Check-in?dataset?latitude?and?longitude?distribution??图4.6统计了用户签到的相邻位置间的距离与用户签到位置的概率的分布,从图中??能够看出,用户签到位置的概率与用户签到的相邻位置间的距离成反比,即相邻签到位??置的距离越近,那么用户签到该位置的槪率越大。??0.6????0.5?—\???0.4?\???\??率.\??0.2?-—A?——??〇1????0?10?20?30?40?50?60??距禽(km)??图4.?6用户相邻签到位置的距离分布??Fig.4.6?Distance?distribution?of?users'?adjacent?check-in?locations??-45?-??
【参考文献】:
期刊论文
[1]基于知网的词语语义相似度改进算法[J]. 李蕾,杨丽花. 计算机技术与发展. 2019(04)
[2]一种基于HowNet语义计算的综合特征词权重计算方法[J]. 孙丽莉,张小刚. 统计与决策. 2018(18)
[3]基于句法路径的中文评论细粒度情感分析[J]. 胡征,陈尔希,曾献辉,蔡一. 信息技术. 2018(09)
[4]基于依存句法的跨语言细粒度情感分析[J]. 唐晓波,刘一平. 情报理论与实践. 2018(06)
[5]基于用户兴趣的协同过滤推荐算法[J]. 宋晨晨,曲朝阳,任有学,刘耀伟,牛强,独健鸿. 民营科技. 2017(07)
[6]基于改进相似性度量的项目协同过滤推荐算法[J]. 于金明,孟军,吴秋峰. 计算机应用. 2017(05)
[7]基于多特征融合的微博主题情感挖掘[J]. 黄发良,冯时,王大玲,于戈. 计算机学报. 2017(04)
[8]基于知网与词林的词语语义相似度计算[J]. 朱新华,马润聪,孙柳,陈宏朝. 中文信息学报. 2016(04)
[9]基于时间感知的地点推荐算法[J]. 卢露. 计算机工程与科学. 2016(03)
[10]时间衰减制导的协同过滤相似性计算[J]. 李源鑫,肖如良,陈洪涛,赵婷,李宏恩. 计算机系统应用. 2013(11)
硕士论文
[1]基于深度特征提取的文本情感极性分类研究[D]. 田竹.山东大学 2017
[2]基于统计方法的中文短文本情感分析[D]. 卢兴.北京理工大学 2016
[3]基于位置服务的个性化推荐算法研究[D]. 林学钦.华南理工大学 2012
[4]基于语义的标签推荐系统关键问题研究[D]. 邓双义.华东师范大学 2010
本文编号:3335637
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3335637.html