当前位置:主页 > 社科论文 > 图书档案论文 >

基于用户生成内容的饮食偏好挖掘及其应用研究

发布时间:2020-08-08 02:24
【摘要】:饮食是人类生存和发展的基本条件之一,也是人们日常生活中经常讨论的话题。挖掘群体用户的饮食偏好,不仅能够揭示不同群体在饮食习惯上的差异,而且由此可反映区域饮食文化的发展和传播情况。传统的饮食偏好挖掘研究大多依据问卷调查、访谈等方式完成,取得了较多相关研究成果。然而,传统研究存在研究对象数据规模小、数据收集时间长等局限性。随着在线社交网络的发展与智能终端的普及,越来越多的人通过互联网表达和传递生活中各方面的讯息,由此产生海量的用户生成内容。这为研究用户饮食偏好提供充分的数据基础。同时,海量用户生成内容主题分散、且质量参差不齐,这在一定程度上增加了用户获取高质量饮食信息的难度。为此,本文以“大众点评”网站上的用户评论为数据源,进行地区与个体两种层面上的用户饮食偏好挖掘研究,在此基础上为网络用户推荐餐馆信息。在地区用户饮食偏好挖掘方面,本文利用属性级情感分析方法,从饮食关注度、饮食相似度以及饮食满意度三个方面,挖掘地区用户的饮食偏好。实验结果表明:不同地区用户的饮食偏好存在差异,多数地区的用户对当地菜系的关注程度较大,地理位置的邻近性与用户饮食偏好间存在显著的相关关系。该结果可为各地餐馆在制定菜单与调整经营策略时提供参考建议。个体用户饮食偏好挖掘的主要目的是挖掘个体用户的饮食需求或兴趣。在个体用户饮食偏好挖掘方面,本文将用户饮食兴趣分为三类,即:菜肴兴趣、饮食属性兴趣以及社会兴趣,并利用关键词来表示用户饮食兴趣。实验结果表明:本文在对用户饮食兴趣进行分类的基础上,利用基于关键词的向量空间模型表示方法能够在一定程度上挖掘个体用户的饮食偏好信息,基于用户近期评论内容构建的饮食兴趣模型,在预测用户未来的饮食偏好方面能得到更好的效果。在餐馆信息推荐应用研究方面,本文首先构建餐馆信息表示模型,然后基于地区和个体用户的饮食偏好研究成果,构建用户饮食兴趣模型,计算用户饮食兴趣模型和餐馆信息表示模型的相似度,其次利用地区用户饮食偏好挖掘中用户饮食满意度的研究方法,度量用户对餐馆的预期满意度,最后基于模型相似度和餐馆的满意度,确定为用户所要推荐的餐馆及其饮食信息,并评估推荐效果。实验结果证实了本文所提餐馆推荐方法的有效性,该方法能在一定程度上为用户提供其感兴趣、高质量的餐馆信息,能满足用户个性化的饮食需求。本文研究不但可以为饮食文化研究提供新的研究视角,还可以为用户信息推荐实践提供参考。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G252.7;TS971
【图文】:

句法分析,示例,依存关系,情感


3基于用户生成内容的各地区用户饮食偏好挖掘研宄逦硕士学位论文逡逑示。该评论句中“宫保鸡丁”、“味道”、“价格”为评价对象,“不错”、“便宜”为情感词,逡逑箭头指向为该词的父节点。因此,“味道”是“不错”的父节点,其依存关系为SBV,逡逑而“味道”又是“宫保鸡丁”的子节点,依存关系为ATT,“宫保鸡丁”与“不错”间的逡逑关系由“味道”传递。因此,本文抽取依存关系组合来确定评价对象与情感词间最常出逡逑现的关系,以依存组合“SBV-COO-ATT”为例,其表示的含义如图3.3所示,对于评价逡逑对象a,抽取a与父节点b的依存关系、b与其父节点c的依存关系和a与其子节点d的逡逑依存关系,最后得出关系组合“SBV-COO-ATT”。因此,对于一条包含评价对象的评论逡逑句,若情感词出现在b、c、d任一位置,则抽取当前评价对象和情感词之间的依存关系逡逑组合,并记录情感词出现的位置。以图3.3为例,若情感词出现在b、c、d的位置,则逡逑分别表示为邋“SBV-C00-ATT-1”、“SBV-COO-ATT-2”,“SBV-C00-ATT-3”。逡逑

依存关系,示例,情感,评价对象


而“味道”又是“宫保鸡丁”的子节点,依存关系为ATT,“宫保鸡丁”与“不错”间的逡逑关系由“味道”传递。因此,本文抽取依存关系组合来确定评价对象与情感词间最常出逡逑现的关系,以依存组合“SBV-COO-ATT”为例,其表示的含义如图3.3所示,对于评价逡逑对象a,抽取a与父节点b的依存关系、b与其父节点c的依存关系和a与其子节点d的逡逑依存关系,最后得出关系组合“SBV-COO-ATT”。因此,对于一条包含评价对象的评论逡逑句,若情感词出现在b、c、d任一位置,则抽取当前评价对象和情感词之间的依存关系逡逑组合,并记录情感词出现的位置。以图3.3为例,若情感词出现在b、c、d的位置,则逡逑分别表示为邋“SBV-C00-ATT-1”、“SBV-COO-ATT-2”,“SBV-C00-ATT-3”。逡逑Root逦莒灥丁味逼逦方错逦.逦价格邋也便宜邋?逡逑图3.2依存句法分析结果示例11逡逑/^c00^\逡逑评价对象a逦a的父节点b逦b的父节点c逦a的子节点d逡逑ATT逡逑图3.3依存关系组合示例逡逑②

数量分布,美食,数量分布,历年


逡逑统计各年份饮食评论数量得到如图3.6所示的结果。从图中可以发现,自2003年逡逑起,饮食评论数量有着不断增长的趋势,说明近些年餐饮业的发展迅猛,伴随互联网的逡逑发展和智能终端的普及,越来越多的用户通过社交网络平台发表、传递或寻找饮食信息。逡逑正因如此,在线饮食偏好挖掘研究才遇到了前所未有的机遇。除此之外,本文引入了菜逡逑系菜肴数据,该数据是根据Zhu等人[221于2012年4月从“美食杰”网站采集的菜系菜逡逑肴数据,经过人工清洗过滤,确保一道菜肴仅属于一个菜系,最终获得20种菜系,包逡逑含5154道菜肴信息。各菜系及其包含的菜肴数量如表3.2所示,川菜、鲁菜、|挡税义希保插澹瑁簦簦穑海螅恚幔妫欤椋洌幔睿澹洌酰悖

本文编号:2784897

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2784897.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4ad2b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com