虚拟空间中社会分层行为研究
发布时间:2021-01-07 21:39
信息化和数字化的迅速发展,使得互联网成为与现实空间相对的最重要的虚拟空间。传统虚拟空间中的社会分层研究多基于网络信息资源占有的机会和能力等客观指标,并未涉及用户使用网络资源的具体行为及上网信息的内容和性质等因素。学术界比较公认的是虚拟空间中也存在着社会分层现象,但对其是否延续现实空间中的社会分层结构观点不一。针对以上问题,本文以中国互联网络信息中心提供的用户行为大数据为基础,主要做了以下工作:1、虚拟空间与现实空间社会分层映射。对照用户属性表,将样本数据按照用户在现实空间所处的社会阶层进行划分,从在线时间和上网内容两方面进行社会分层特征研究。对在线时间数据进行均值方差处理,观察不同阶层用户上网行为的稳定性。将用户点击的软件进程信息向量化,然后使用Word2vec算法提取出能代表各阶层用户行为特征的词向量,此外,计算了用户在不同类别的软件中消耗注意力的持续时间。分析不同阶层用户在线时间的稳定性、上网行为的规律性及消耗注意力的软件类别,发现虚拟空间延续着现实空间中的社会分层结构。2、不同阶层用户的行为特征提取。提取了教育、经济、年龄等不同维度下每类用户的点击软件进程数据,构建词汇表,得到每...
【文章来源】:西北师范大学甘肃省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
数据样本
西北师范大学硕士学位论文4本文从所有数据中随机抽取了1000个用户连续一个月约1.2亿条的上网点击行为数据记录。数据文件包括按日期归档的样本行为日志和样本的人口属性信息两部分,二者可通过用户ID进行关联。用户的人口属性信息表中包括用户的性别、年龄、学历、职业、工资、所在地等信息[27],如图1-2所示。图1-2用户人口属性信息示例本文在进行数据划分时,用到人口属性信息中的BIRTHDAY(年龄)、EDU(教育背景)、JOB(职业)、PROVINCE(省份)四个属性。在进行不同阶层用户的特征提取与识别时,用到样本行为日志中的以下四个参数,如表1-1所示。表1-1参数介绍参数名参数含义Last样本用户的在线持续时间L_start样本用户的开机时间T当前点击行为距离开机时间的秒数P用户点击的软件进程名1.4研究内容与框架本文将社会学与计算机相结合,利用机器学习算法、神经网络模型等研究虚拟空间中的社会分层问题。在社会分层相关理论基础上,通过机器学习算法分析不同社会阶层用户的在线点击行为数据,观察现实空间中处于同一阶层、不同阶层的用户在虚拟空间中的上网时间、点击行为有什么异同,进而分析各阶层在虚拟空间中被什么样的信息资源所吸引,分析虚拟空间与现实空间中的社会分层结构是否一致。此外,本文提出一种基于行为特征推断互联网中的用户所处社会阶层的方法,通过建立神经网络模型对虚拟空间中的在线点击行为数据进行社会分层识别,证明虚拟空间中存在能够区分用户社会阶层的行为特征。本论文共分为4章,各章内容如下:第一章为绪论。首先介绍了论文的研究背景及意义,其次阐述论文的研究目的,接着描述了本文使用的数据来源,最后介绍了论文的主要研究内容和框架。
第2章行为数据分层特征提取921()=-=CisissMVC(2-8)某职业中所有用户在线持续时间的方差为:21()=-=CididdMVC(2-9)伪代码如下:输入:iD输出:,bsdbsdMM,M,V,V,V过程:Lables=[b,d,s]//b、d、s分别为用户的开机时间、在线持续时间和关机时间ForlabelinLables:计算iD中用户开机时间b的均值bM计算iD中用户开机时间b的方差bV计算iD中用户关机时间s的均值sM计算iD中用户关机时间s的方差sV计算iD中用户在线持续时间d的均值dM计算iD中用户在线持续时间d的方差dVEndfor2.2.2点击进程数据处理方法首先,将原始样本行为日志转化为Excel格式,如图2-3所示。图2-3Excel格式的样本数据其中,P列为用户当前点击的软件进程名,T列为用户当前点击行为距离开机时间的秒数。接着将样本数据划分为社会上层、社会中层、社会下层三个数据集。然后提取每个数据集下所有Excel文件中的p列,提取之后的数据样本如图2-4所示。
【参考文献】:
期刊论文
[1]论社会学理论导引的大数据研究——大数据、理论与预测模型的三角对话[J]. 罗家德,刘济帆,杨鲲昊,傅晓明. 社会学研究. 2018(05)
[2]公共话语中的社会分层关注度——基于书籍大数据的实证分析(1949-2008)[J]. 柳建坤,陈云松. 社会学研究. 2018(04)
[3]中国城乡居民的阶层地位认同偏差[J]. 范晓光,陈云松. 社会学研究. 2015(04)
[4]虚拟社会分层:动因、维度与趋势[J]. 陈强,徐晓林. 情报杂志. 2015(07)
[5]网络社会分层的异化[J]. 王连慧. 经济研究导刊. 2015(12)
[6]基于小数据的在线用户兴趣长程演化研究[J]. 李勇,孟小峰,刘继,王常青. 计算机研究与发展. 2015(04)
[7]网络社会社会分层的结构转型[J]. 张斐男. 学术交流. 2015(03)
[8]社会计算与计算社会:智慧社会的基础与必然[J]. 王飞跃,王晓,袁勇,王涛,林懿伦. 科学通报. 2015(Z1)
[9]城市计算概述[J]. 郑宇. 武汉大学学报(信息科学版). 2015(01)
[10]中国虚拟社会治理研究中需要关注的几个问题[J]. 徐晓林,陈强,曾润喜. 中国行政管理. 2013(11)
本文编号:2963284
【文章来源】:西北师范大学甘肃省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
数据样本
西北师范大学硕士学位论文4本文从所有数据中随机抽取了1000个用户连续一个月约1.2亿条的上网点击行为数据记录。数据文件包括按日期归档的样本行为日志和样本的人口属性信息两部分,二者可通过用户ID进行关联。用户的人口属性信息表中包括用户的性别、年龄、学历、职业、工资、所在地等信息[27],如图1-2所示。图1-2用户人口属性信息示例本文在进行数据划分时,用到人口属性信息中的BIRTHDAY(年龄)、EDU(教育背景)、JOB(职业)、PROVINCE(省份)四个属性。在进行不同阶层用户的特征提取与识别时,用到样本行为日志中的以下四个参数,如表1-1所示。表1-1参数介绍参数名参数含义Last样本用户的在线持续时间L_start样本用户的开机时间T当前点击行为距离开机时间的秒数P用户点击的软件进程名1.4研究内容与框架本文将社会学与计算机相结合,利用机器学习算法、神经网络模型等研究虚拟空间中的社会分层问题。在社会分层相关理论基础上,通过机器学习算法分析不同社会阶层用户的在线点击行为数据,观察现实空间中处于同一阶层、不同阶层的用户在虚拟空间中的上网时间、点击行为有什么异同,进而分析各阶层在虚拟空间中被什么样的信息资源所吸引,分析虚拟空间与现实空间中的社会分层结构是否一致。此外,本文提出一种基于行为特征推断互联网中的用户所处社会阶层的方法,通过建立神经网络模型对虚拟空间中的在线点击行为数据进行社会分层识别,证明虚拟空间中存在能够区分用户社会阶层的行为特征。本论文共分为4章,各章内容如下:第一章为绪论。首先介绍了论文的研究背景及意义,其次阐述论文的研究目的,接着描述了本文使用的数据来源,最后介绍了论文的主要研究内容和框架。
第2章行为数据分层特征提取921()=-=CisissMVC(2-8)某职业中所有用户在线持续时间的方差为:21()=-=CididdMVC(2-9)伪代码如下:输入:iD输出:,bsdbsdMM,M,V,V,V过程:Lables=[b,d,s]//b、d、s分别为用户的开机时间、在线持续时间和关机时间ForlabelinLables:计算iD中用户开机时间b的均值bM计算iD中用户开机时间b的方差bV计算iD中用户关机时间s的均值sM计算iD中用户关机时间s的方差sV计算iD中用户在线持续时间d的均值dM计算iD中用户在线持续时间d的方差dVEndfor2.2.2点击进程数据处理方法首先,将原始样本行为日志转化为Excel格式,如图2-3所示。图2-3Excel格式的样本数据其中,P列为用户当前点击的软件进程名,T列为用户当前点击行为距离开机时间的秒数。接着将样本数据划分为社会上层、社会中层、社会下层三个数据集。然后提取每个数据集下所有Excel文件中的p列,提取之后的数据样本如图2-4所示。
【参考文献】:
期刊论文
[1]论社会学理论导引的大数据研究——大数据、理论与预测模型的三角对话[J]. 罗家德,刘济帆,杨鲲昊,傅晓明. 社会学研究. 2018(05)
[2]公共话语中的社会分层关注度——基于书籍大数据的实证分析(1949-2008)[J]. 柳建坤,陈云松. 社会学研究. 2018(04)
[3]中国城乡居民的阶层地位认同偏差[J]. 范晓光,陈云松. 社会学研究. 2015(04)
[4]虚拟社会分层:动因、维度与趋势[J]. 陈强,徐晓林. 情报杂志. 2015(07)
[5]网络社会分层的异化[J]. 王连慧. 经济研究导刊. 2015(12)
[6]基于小数据的在线用户兴趣长程演化研究[J]. 李勇,孟小峰,刘继,王常青. 计算机研究与发展. 2015(04)
[7]网络社会社会分层的结构转型[J]. 张斐男. 学术交流. 2015(03)
[8]社会计算与计算社会:智慧社会的基础与必然[J]. 王飞跃,王晓,袁勇,王涛,林懿伦. 科学通报. 2015(Z1)
[9]城市计算概述[J]. 郑宇. 武汉大学学报(信息科学版). 2015(01)
[10]中国虚拟社会治理研究中需要关注的几个问题[J]. 徐晓林,陈强,曾润喜. 中国行政管理. 2013(11)
本文编号:2963284
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2963284.html