当前位置:主页 > 经济论文 > 房地产论文 >

面向稀疏特征的用户属性推断方法研究

发布时间:2020-08-18 17:21
【摘要】:随着智能设备的普及和在线社交网络的繁荣,数十亿用户的状态、轨迹被收集和记录下来。综合的人类行为数据能够揭示用户的特点,反映出他们的基本属性,比如性别、年龄和婚姻状况,甚至还能预测出用户的性格、兴趣爱好、工作领域等内容。从公开的社交媒体数据中推断用户的属性可以广泛应用于精准营销和个性化推荐,对于企业具有重要商业意义。然而,数据的稀疏性为用户属性的推断带来了巨大的困难。针对社交媒体数据本文提出了一种基于连续条件随机场(C-CRF)的用户属性推断方法。首先,本文基于真实数据集分析了文本、签到、移动模式和社交关系四类特征与用户属性之间的关联性。然后,为几类数据设计了不同的特征提取方法,尤其针对稀疏的移动模式数据提出了基于层次结构图的数据模拟生成算法。最后通过基于连续条件随机场的方法融合各类特征,对用户属性进行推断。实验结果表明,本文提出的属性推断方法在效果上优于之前研究中常用的几种基线方法,并且签到数据和移动模式数据的使用有助于用户属性的推断任务。本文主要工作包括以下几个方面:收集整理并扩充了一个真实的社交媒体数据集,包含社交媒体用户的发帖纪录、签到行为记录、签到地点的详细信息、社交关系和人口属性信息等。针对移动模式数据提出了基于层次结构图的特征提取方法,缓解了移动模式记录稀少的问题。提出了基于连续条件随机场的用户属性推断方法来融合各类特征,并在真实数据集上验证了方法的有效性,同时为轨迹数据分析提供了新的角度。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6
【图文】:

轨迹,示例


逦||内容:xx的演技太差了,不忍直视。逡逑图3.1微博轨迹示例逡逑如图3.1所示,编号为179丨225510的用户在2013年8月3号的一条微博轨迹逡逑由:记录:r2、r3、r_4构成记录朽和■发布时fB_它们不隹肩一天所以不能加逡逑入轨迹。“用户轨迹集合”包含一个用户的所有微博轨迹,它的定义如逡逑定义3.1.2.(用户轨迹集合)一个用户的轨迹集合W7?由用户的所有微博轨迹组逡逑成,W7"=邋{万,%,…,?;},其中71即前文定义的由微博记录r构成的微博轨逡逑迹。相应的,WT中出现过的所有记录的文本内容eoniefti构成了用户的文本集合逡逑WC,所有记录包含的经廔度坐标如0构成了用户的签到坐标集合逡逑10逡逑

云图,高频词,领域,云图


图3.3女性和男性用户的高频词词云图逡逑为了寅直观地展示文本内容对于用户属性的区分能力,本文以性别属性和职逡逑业领域属性为例绘制了高频词语的饲云图《图3.2展示了传媒、娱乐和体育领域用逡逑户的高频用词,传媒领域用户的高频饲逋常与电视广播、新闻事件以及H联网等逡逑内容有关,娱乐领域用户的高频词能反映出用户参与的演出排练、与关注者的互逡逑

散点图,热力图,地域,数据


图3.4木橖职业领域用户的签到数据热力图逡逑

【相似文献】

相关期刊论文 前10条

1 王颖;唐万梅;;一种改进的基于用户属性聚类的推荐算法[J];现代计算机(专业版);2017年11期

2 丁宇新;肖骁;吴美晶;张逸彬;董丽;;基于半监督学习的社交网络用户属性预测[J];通信学报;2014年08期

3 娄国哲;王兰成;;基于涉军论坛中用户属性及关系的用户影响力分析[J];中国管理信息化;2016年22期

4 于鑫;魏志光;盛鸿宇;;基于用户属性证书的数字签名在电子政务建设中的应用[J];电子政务;2007年04期

5 吴飞;金士尧;胡浩民;;基于用户属性的个性化教学智能辅助研究和设计[J];计算机工程与科学;2012年09期

6 张治中;;新媒体的用户属性与传统媒体的战略转型[J];新闻战线;2010年05期

7 王斯盾;琚生根;周刚;刘玉娇;;基于集成分类器的用户属性预测研究[J];四川大学学报(自然科学版);2017年06期

8 强磊;;3G通用用户属性及其参考结构的研究[J];信息网络;2006年03期

9 赵宇;李佳艺;王莉;;基于多任务融合模型的用户属性推断[J];数据采集与处理;2018年02期

10 王砚青;;“Feed”爆发[J];英才;2015年03期

相关会议论文 前3条

1 姜劲松;胡谷雨;杨波;缪志敏;朱宝山;;一种基于任务和用户属性的工作流任务分配算法[A];2014第二届中国指挥控制大会论文集(上)[C];2014年

2 ;中国网络约租车服务用户研究报告 2015年[A];艾瑞咨询系列研究报告(2015年第12期)[C];2015年

3 张琦;乔卫勇;;RACF介绍[A];第二次计算机安全技术交流会论文集[C];1987年

相关重要报纸文章 前1条

1 本报记者 别坤;王效辙:扁平化网络更高效[N];计算机世界;2013年

相关博士学位论文 前2条

1 冯珍;产品级再使用研究[D];西安电子科技大学;2005年

2 李文峰;基于主题模型的用户建模研究[D];北京邮电大学;2013年

相关硕士学位论文 前10条

1 李佩佩;面向稀疏特征的用户属性推断方法研究[D];华东师范大学;2018年

2 乔伊娜;基于强关系的用户属性信息推断方法[D];哈尔滨工业大学;2018年

3 赵宇;基于多任务融合模型的用户属性推断[D];太原理工大学;2018年

4 胡纪坤;基于移动终端应用的用户属性预测[D];广东工业大学;2018年

5 陶建容;基于智能手机应用数据的用户属性挖掘[D];浙江大学;2017年

6 秦Z诼

本文编号:2796512


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/fangdichanjingjilunwen/2796512.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户33c23***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com