当前位置：主页 > 论文百科 > 农业期刊 >

微博用户的相似性度量及其应用

发布时间：2017-01-02 17:33

本文关键词：微博用户的相似性度量及其应用，由笔耕文化传播整理发布。

１期

徐志明等：微博用户的相似性度量及其应用

２０９

括可分为几个部分：数据获取、节点分析、关系分析、博用户关系分析的技术平台（如图１所示），本文下网络分析、信息推荐．将它们组合起来，形成一个微

面分别详细介绍各个部分的工作原理．

微博数据获取

。———］

ｉ微博节点分析

微博关系分析

ｔ

／

ｌ熟寻苟点。｝

列表／

微博用户信息

微博用户表示

：属性相似度计算Ｉ

０

ｌ背景信息Ｉ

。Ｉ

８目女；Ｉ一

Ｈ背景相似度Ｉ：

ｌ微博Ｉ

用户

ｌ爬虫】

Ｉ微博文本ｌ

｛—一文本相似度Ｉ

相似

』

Ｉ…。…’ｏ：；ｏ。。。’’一ｌ

ｂｌ文本向量Ｉ－

｛｛；。。ｈ…。：∥

Ｉｊ＼人度计

算

ｌ∈博数据库叶

Ｉ社交信息Ｉ；卜１Ｉ社交向量ｌＩＩ：７１”ｘ＋＇ＩＥＩｏ”“Ｉ

！Ｉ

ｌ交互行为１

－Ｉ姬频次向量Ｉ

，ｌ交互性Ｉ

一

微博网络分析．

●

用户相似性网络

。１ｍⅫ日¨＊＊ｉ７ｌｌｍｌ圩Ⅲｍ】６Ⅷ

。ｌ＿｛Ⅻ』ｂ““Ｊ１。ｌｍⅫ－ｍＨ★＆＃７ｌ…““”“１１

ｌ””“”１‘”

．

一’

图１微博用户关系分析的技术平台

２．１微博数据获取

（２）Ｔｗｅｅｔ（Ｕ）：表示Ｕ发布的全部微博所拼接该部分根据新浪微博开放平台的ＡＰＩ接口，设成的长文本．本文将其表示为一个文本向量．过程

计了一个微博爬虫算法．它选择一组微博用户作为如下：

种子节点，利用雪球采样策略采集一组微博用户的文本预处理．对Ｔｗｅｅｔ（“）进行分词、停用词过个人数据，作为本文的实验数据．主要思想如下．

滤、词性标注等处理；

（１）选择一组微博用户｛１Ｄ，，ＩＤ。，…，ＩＤ。）作特征提取．采用信息增益的特征选择算法提取为种子节点，加入待爬行节点队列Ｑ．

Ｔｗｅｅｔ（“）的特征词，对文本进行降维处理；

（２）如果Ｑ—ＮＵＬＬ或超过阈值（预设的爬行权重计算．Ｔｗｅｅｔ（Ｕ）中的每个特征词ｉ的权时间或扩展层数），则退出；否则从Ｑ中取出一个用重硼。，本文采用￡，＊ｉｄｆ方法来计算，即硼ｉ＝户ｌＤｔ．

ｔｆ，（Ｔｗｅｅｔ（“））×ｌｏｇＮ／ｎｉ，其中ｔｆ，（Ｔｗｅｅｔ（Ｍ））表示（３）利用新浪微博ＡＰＩ访问函数，抓取该用户特征词ｉ在Ｔｗｅｅｔ（“）中的频率，ｌｏｇＮ／ｎｉ为特征词ｉ节点ＩＤ。的个人信息，将用户的背景信息（位置信

的逆文档频率．

息、标签信息、个人描述）、社交信息（关注信息、粉丝

向量表示．Ｔｗｅｅｔ（甜）一（训ｌ，训２，…，训。），其中信息）、微博文本、交互信息（转发信息、评论信息），硼，为微博文本的某个特征词ｉ的权重．

分别存入微博用户信息数据库．

（３）Ｒｅｌａｔｉｏｎ（“）：表示Ｕ的社交信息，包括两种（４）扩展该节点ＩＤ。，将其邻居节点（ＩＤ。的关注属性信息（关注信息、粉丝信息），本文将它们分列表中的全部用户ＩＤ）加入Ｑ，转到（２）．别表示为两个向量：关注向量Ｆｏｌｌｏｗｅｅ（“）、粉丝向２．２微博节点分析

量Ｆｏｌｌｏｗｅｒ（Ｕ），则Ｒｅｌａｔｉｏｎ（Ｕ）一｛Ｆｏｌｌｏｗｅｅ（Ｕ），该部分讨论微博用户信息的模型表示方法．对Ｆｏｌｌｏｗｅｒ（“））．具体方法是：将所有用户编号｛０，１，于给定的一个用户“，，其用户信息包含４种属性信２，…，ｎ｝，若用户“关注了编号为ｉ的用户，则息（背景信息、微博文本、社交信息、交互信息），因此Ｆｏｌｌｏｗｅｅ（“）的第ｉ个分量为１，否则为０；同理，如果Ｕ的模型表示问题可分解为４种属性信息表示问编号为ｉ的用户关注了用户Ｕ，则Ｆｏｌｌｏｗｅｒ（“）的第题．即Ｐｒｏｆｉｌｅ（Ｕ）一｛Ｂａｃｋｇｒｏｕｎｄ（“），Ｔｗｅｅｔ（Ｕ），ｉ个分量为ｌ，否则为０．

Ｒｅｌａｔｉｏｎ（ｕ），Ｉｎｔｅｒａｃｔｉｏｎ（“）），具体说明如下：

（４）Ｉｎｔｅｒａｃｔｉｏｎ（“）：表示Ｕ的交互信息，包括（１）Ｂａｃｋｇｒｏｕｎｄ（“）：表示Ｕ的背景信息，包含两种属性信息（ｇｑ发信息、评论信息）．本文将它们Ｕ的３种属性信息（位置信息、标签信息、个人描述），分别表示为两个向量：转发向量Ｒｅｔｗｅｅｔ（“）、评论均是短文本，可表示为字符串．Ｂａｃｋｇｒｏｕｎｄ（Ｕ）一

向量Ｃｏｍｍｅｎｔ（Ｕ）．Ｉｎｔｅｒａｃｔｉｏｎ（Ｕ）＝｛Ｒｅｔｗｅｅｔ（Ｕ），｛Ｐｌａｃｅ（“），Ｔａｇ（“），Ｉｎｔｒｏｄｕｃｔｉｏｎ（“）｝．

Ｃｏｍｍｅｎｔ（“））．具体方法是：将所有用户编号｛０，１，

本文关键词：微博用户的相似性度量及其应用，由笔耕文化传播整理发布。

本文编号：232071

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/wenshubaike/xxkj/232071.html

上一篇：《基于多代理系统的多微网能量协调控制 Energy coordination control of mu
下一篇：微博用户的相似性度量及其应用资料.pdf 全文免费在线阅读

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|