基于多模态的用户画像系统

发布时间:2021-10-13 23:21
  随着互联网的蓬勃发展,多样化的社交媒体网络应运而生。用户在不同的社交媒体平台留下了丰富的用户信息和海量的结构化与非结构化数据,而且这些数据是用户自发产生的,具有很高的真实度和多样性。通过对用户产生的多源多模态数据进行综合分析,能更准确、全面地理解用户画像。本文主要从跨平台的角度对多源的社交媒体网络进行了分析,以用户为纽带深入挖掘和提炼跨平台数据中的联合信息,提高多源数据的利用率,同时引入人格维度,构建更丰富的用户画像。本文的主要工作如下。1.关联用户在新浪微博和网易云音乐两个社交平台的账号,通过爬虫技术爬取用户在不同平台产生的数据,包括微博文本、个人信息、喜欢的音乐等多种结构化和非结构化数据,并通过文本清洗、标签提取、偏好聚类等方法,构建规则整齐的多源多模态真实社交数据集。2.基于SC-LIWC字典提取用户微博文本中心理学词频特征,建立用户人格映射分词模型,采用基于微博文本的CNN线性回归网络计算用户大五人格,摆脱了传统的基于调查问卷的获取用户人格的束缚。同时分析用户人格与用户属性、用户行为和微博标签之间的关系,构建微博画像。3.基于音乐标签计算用户音乐类别偏好和音乐情绪偏好,并用K-... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:70 页

【学位级别】:硕士

【部分图文】:

基于多模态的用户画像系统


用户画像示愈图

示意图,音乐,社区,网易


微博的数据广泛地被应用在学术界和工业界的研究中,这些用户数据是用??户在社交平台的使用过程中自主产生的,具有很高的可信度和分析价值。用户在??新浪微博社区上的主页示意图如图1-2所示。??’?W'霤?*?I??到:??ipMll??图1-2用户在新浪微博社区的主页示意图??网易云音乐也是近年来在中国迅速流行起来的一个音乐社区,截至2017年??11月,网易云音乐用户数己突破4亿大关[4]。随着现代社会生活,人们物质水平??的提高,大家己经不满足于追求简单的物质生活,慢慢也开始重视精神生活的丰??富程度。音乐自古以来就是与人类的生活息息相关的精神食粮,极大地提高了人??们的精神生活的丰富度。网易云音乐就是一个很好的聆听音乐的平台,用户在网??易云音乐社区上的主页示意图如图1-3所示。??2??

示意图,网易,音乐,社区


微博的数据广泛地被应用在学术界和工业界的研究中,这些用户数据是用??户在社交平台的使用过程中自主产生的,具有很高的可信度和分析价值。用户在??新浪微博社区上的主页示意图如图1-2所示。??’?W'霤?*?I??到:??ipMll??图1-2用户在新浪微博社区的主页示意图??网易云音乐也是近年来在中国迅速流行起来的一个音乐社区,截至2017年??11月,网易云音乐用户数己突破4亿大关[4]。随着现代社会生活,人们物质水平??的提高,大家己经不满足于追求简单的物质生活,慢慢也开始重视精神生活的丰??富程度。音乐自古以来就是与人类的生活息息相关的精神食粮,极大地提高了人??们的精神生活的丰富度。网易云音乐就是一个很好的聆听音乐的平台,用户在网??易云音乐社区上的主页示意图如图1-3所示。??2??


本文编号:3435601

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3435601.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7fb19***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com