基于社交网络的性格分析与预测
发布时间:2021-04-18 09:58
在社交网络中,个人头像作为一种稳定的内容,被用户用来对外展示个人的形象,头像中呈现的人脸和风格特征受用户的性格等因素影响而有所不同。同样,用户日常发布的图像因用户的性格和人口统计学特征的不同而出现差异。人的性格唯一地刻画了一个个体,并且影响着个体的精神状态和社会行为。基于社交网络的性格研究,有利于针对性的社交推荐、线上营销、舆论控制。在数据科学领域,传统的性格研究多采用问卷调查方式和用户的文本数据。该方式有诸多的问题,比如,问卷调查实施困难,模型性能严重依赖文本特征。本文提出基于社交网络的性格分析和预测,使用推特用户在线上活动中产生的两类图像数据推断用户性格。本文主要工作有社交网络中用户数据获取、图像特征提取和筛选、分类器筛选。其中提取和筛选图像特征为研究的重点内容。大五性格模型[2]用于划分用户的性格,该模型统一了个体在性格方面的差异,将性格划分为五个主要维度:随和性(Agreeableness)、尽责性(Conscientiousness)、外倾性(Extroversion)、情绪性(Neuroticism)、开放性(Openness)。首先,使用网络爬虫程序...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
用户头像分类64%默认头像两张人脸一张人脸三张张人脸大于三张人脸
西南大学硕士学位论文28个原因是,对于不同的领域,风格的定义带有严重的主观因素,以至于对于不同人,同一张图像往往有不同风格判定。图3-4展示4种不同风格的图像,“Detailed”风格和“Noir”风格仅通过人眼就能轻易区分,前者主要捕捉对象小范围的细节,而后者则来源于一种电影风格——黑色电影,该风格下的图片多取材于该类型电影中的场景,单一的黑色场景和单一的光源。“Romantic”和“Vintage”风格的图像仅通过人眼难以分辨,前者场景多包含丰富的色彩、风景,后者则拥有丰富色彩的同时,体现复古、旧式等特点。后面两种风格不仅体现在图像的内容中,还体现在图像的整体特征。这种整体特征由于其抽象性,普通机器学习算法很难提龋图3-4几种不同风格的图像深度卷积神经网络(CNN)在许多机器视觉任务中表现的非常好,从低层次的图像处理,比如提高图像的分辨率,到高层次的图像理解,比如图像分类、目标分割。CNN的成功得益于其对图像不同层次的特征表达能力。本文中描述的图像抽象风格实际上是图像的纹理信息,这种纹理信息既包含了图像的局部特征,比如,色彩、边缘、形状,还包含了这些局部特征之间的关系。正是这种特征之间的关系很好的体现了风格的整体性特点,使得图像的纹理信息在应用到风格识别任务中时有较好的表现,对比同类研究是最优的方法。通过改造CNN的结构使得其不仅能够提取图像局部的特征,还对全局性的特征具有良好的表达能力。对抽象风格特征的提取,本文使用2.3.2小节中介绍的双通道深度卷积神经网络,在Flickr数据集[13]上训练模型提取头像抽象风格的能力。Flickr数据集将图像风格分为5个组别,20种小类,一共包含80000张图片,每张图片由3至5名从事摄影工作的专业人员投票标注,每张图片可
第3章基于社交网络的性格分析与预测29的大小划分比例为60:20:20,图像被裁剪成256x256大小,为了增加训练数据集的规模,将输入图片随机裁剪成4张224x224大小的图片,图像最终的预测结果为4张图像预测结果的均值。表3-3Flickr数据集中图像风格类别特征类别具体特征光学技术Macro,Bokeh,DepthofFiled,LongExposure,HDR氛围Hazy,Sunny情绪Serene,Melancholy,Ethereal结构Minimal,Geometric,Detailed,Texture色彩Pastel,Bright流派Noir,Vintage,Romantic,Horror模型的训练和应用过程如图3-5所示,训练基于caffe深度学习框架[32],Caffe全称ConvolutionalArchitectureforFastFeatureEmbedding,是一种高效的开源深度学习框架,可以部署在不同平台上,在学术界和工业界有着广泛的应用。由于该模型的训练涉及80000张原始图片和超过1亿个网络参数,需要强大的计算能力,仅依靠普通桌面电脑的中央处理器需要漫长的训练时间。为了缩短模型的训练时间,选择租用谷歌云平台(GCP)的深度学习服务器来搭建实验平台。凭借该平台丰富的GPU资源,模型在数小时内训练完成。图3-5抽象风格模型训练和应用过程3.2.4样本标记在实验中我们并没有使用问卷调查的方式标记用户的性格,而是使用IBM的PersonalityInsight服务标记用户的性格。选择成熟的商用模型主要出于以下几点考虑。首先,实验样本的来源使得我们无法获取大量的问卷反溃其次,现有模型基于海量数据和最优研究方法建立,一定程度上可以通过这些模型获取到与问卷调
【参考文献】:
期刊论文
[1]基于性格特征的社会化媒体用户学术信息搜寻行为感知差异研究[J]. 张晋朝,罗博,查先进. 信息资源管理学报. 2018(04)
本文编号:3145281
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
用户头像分类64%默认头像两张人脸一张人脸三张张人脸大于三张人脸
西南大学硕士学位论文28个原因是,对于不同的领域,风格的定义带有严重的主观因素,以至于对于不同人,同一张图像往往有不同风格判定。图3-4展示4种不同风格的图像,“Detailed”风格和“Noir”风格仅通过人眼就能轻易区分,前者主要捕捉对象小范围的细节,而后者则来源于一种电影风格——黑色电影,该风格下的图片多取材于该类型电影中的场景,单一的黑色场景和单一的光源。“Romantic”和“Vintage”风格的图像仅通过人眼难以分辨,前者场景多包含丰富的色彩、风景,后者则拥有丰富色彩的同时,体现复古、旧式等特点。后面两种风格不仅体现在图像的内容中,还体现在图像的整体特征。这种整体特征由于其抽象性,普通机器学习算法很难提龋图3-4几种不同风格的图像深度卷积神经网络(CNN)在许多机器视觉任务中表现的非常好,从低层次的图像处理,比如提高图像的分辨率,到高层次的图像理解,比如图像分类、目标分割。CNN的成功得益于其对图像不同层次的特征表达能力。本文中描述的图像抽象风格实际上是图像的纹理信息,这种纹理信息既包含了图像的局部特征,比如,色彩、边缘、形状,还包含了这些局部特征之间的关系。正是这种特征之间的关系很好的体现了风格的整体性特点,使得图像的纹理信息在应用到风格识别任务中时有较好的表现,对比同类研究是最优的方法。通过改造CNN的结构使得其不仅能够提取图像局部的特征,还对全局性的特征具有良好的表达能力。对抽象风格特征的提取,本文使用2.3.2小节中介绍的双通道深度卷积神经网络,在Flickr数据集[13]上训练模型提取头像抽象风格的能力。Flickr数据集将图像风格分为5个组别,20种小类,一共包含80000张图片,每张图片由3至5名从事摄影工作的专业人员投票标注,每张图片可
第3章基于社交网络的性格分析与预测29的大小划分比例为60:20:20,图像被裁剪成256x256大小,为了增加训练数据集的规模,将输入图片随机裁剪成4张224x224大小的图片,图像最终的预测结果为4张图像预测结果的均值。表3-3Flickr数据集中图像风格类别特征类别具体特征光学技术Macro,Bokeh,DepthofFiled,LongExposure,HDR氛围Hazy,Sunny情绪Serene,Melancholy,Ethereal结构Minimal,Geometric,Detailed,Texture色彩Pastel,Bright流派Noir,Vintage,Romantic,Horror模型的训练和应用过程如图3-5所示,训练基于caffe深度学习框架[32],Caffe全称ConvolutionalArchitectureforFastFeatureEmbedding,是一种高效的开源深度学习框架,可以部署在不同平台上,在学术界和工业界有着广泛的应用。由于该模型的训练涉及80000张原始图片和超过1亿个网络参数,需要强大的计算能力,仅依靠普通桌面电脑的中央处理器需要漫长的训练时间。为了缩短模型的训练时间,选择租用谷歌云平台(GCP)的深度学习服务器来搭建实验平台。凭借该平台丰富的GPU资源,模型在数小时内训练完成。图3-5抽象风格模型训练和应用过程3.2.4样本标记在实验中我们并没有使用问卷调查的方式标记用户的性格,而是使用IBM的PersonalityInsight服务标记用户的性格。选择成熟的商用模型主要出于以下几点考虑。首先,实验样本的来源使得我们无法获取大量的问卷反溃其次,现有模型基于海量数据和最优研究方法建立,一定程度上可以通过这些模型获取到与问卷调
【参考文献】:
期刊论文
[1]基于性格特征的社会化媒体用户学术信息搜寻行为感知差异研究[J]. 张晋朝,罗博,查先进. 信息资源管理学报. 2018(04)
本文编号:3145281
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3145281.html
最近更新
教材专著