当前位置:主页 > 管理论文 > 移动网络论文 >

网络空间中人格分析的研究与实现

发布时间:2021-04-15 04:44
  人格是对人类个体特征的高度概括,是区分人与人之间差别的量化标准,能够描述个体的独特性。人格在个体的遗传、环境、学习等因素的共同作用下形成,具有较强的稳定性。因此各研究领域经常将人格作为对“人”研究的重要指标。人格不仅与人类在现实生活中的情绪、语言、行为息息相关,也与人类在网络空间中的行为密切相关。网络空间行为的易记录性、以及快速发展的数据挖掘等技术,使得网络空间中的用户人格分析具备了可行性,并逐渐成为当前的研究热点。利用网络空间中的数据进行人格分析,对传统心理学的人格分析而言具有借鉴意义,并且借助机器学习技术构建的人格分析模型,在获取用户数据的情况下,能够短时间内产生大量的用户人格信息,为后续提升用户个性化等服务的质量提供支持。因此,网络空间中的人格分析具有重要的现实意义。本文中人格分析的研究将以社交网络为切入点。近年来,社交网络数据已成为人格分析的一个重要数据源,其中社交网络状态文本包含了丰富的用户语言信息,与用户人格之间存在很强的关联性,因此过去许多的研究都利用社交网络用户发布的状态来分析用户的人格,但由于获取有标签数据的成本较高,过往研究都是在少量有标签数据的基础上进行的,影响了... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

网络空间中人格分析的研究与实现


图2-2罗夏墨迹测验中的一张图片[18]??投射测验的优点在于有机会把被试者最原始的心理特征表现出来,缺点在于??,

视图,视图,分类器,高置信度


在每一轮预测结束之后,PMC将两个分类器得到的高置信度预测样本的并??集加入到原来的训练集中,这样相当于每个分类器都把一部分自身学习到的信息??提供给另一个分类器。直观上理解,如图3-2所示,如果将高置信度预测样本的??并集加入到原来的训练集中,那么一定会存在一部分分类器1认为置信度高的样??本点,对分类器2而言是随机分布的,同理也会有一部分分类器2认为置信度高??的样本点,对分类器1而言是随机分布的,这样就达到了“相互学习”的目的。??IS??(a)?X1?view?(b)?x2?view??图3-2存在“分歧”的两个视图??需要指出,与传统的Co-training方法相比,PMC的区别在于:(1)没有使??用预先划分的视图,而是在训练过程中自动划分视图。(2)训练过程中划分的视??图不是从头至尾固定不变的。PMC相当于将Co-training算法扩展到了单视图学??习中。??3.?2文本特征提取??在本文的实验中,为了提取更丰富的语言特征,将采用三类语言特征:LIWC,??N-gram和LDA。LIWC常被作为语言特征用于社交网络人格分析中,具有良好??的信效度

模型图,模型,主题分布,主题


LDA:假设有M篇文档,对应第d个文档中有n个词。LDA解决的问题是??要找到每一篇文档的主题分布和每一个主题中词的分布。训练的过程如下:??首先假设主题模型的个数K,那么LDA模型的解决方案为如图3-3所示:??〇F〇f^?*-l-y〇4〇??v?h?Tl??I?A1?D?一__K??图3-3?LDA模型??每一篇文档的主题分布和每一个主题中词的分布是两个独立的分布,我们可??以分别假设。??Dirichlet分布是多项式的概率分布,我们目的是得到文档在各个主题的分布??概率,所以对任意一文档,可以使用Dirichlet分布作为主题分布的先验分布:??8d?=?Dirichlet(a)?(3-12)??其中,a为分布的超参数,是一个K维向量。??LDA假设主题中词的先验分布是Dirichlet分布,即对于任意主题A:,其词分??布卩k为??Pk=?Dirichlet(fj)?(3-13)??其中,为分布的超参数,是一个7维向量。7代表词汇表里所有词的个数。??对于数据中任一一篇文档d中的第n个词,我们可以从主题分布化中得到它??的主题编号的分布为:

【参考文献】:
期刊论文
[1]社交网络用户的人格分析与预测[J]. 张磊,陈贞翔,杨波.  计算机学报. 2014(08)



本文编号:3138694

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3138694.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9c1fe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com