在线社会网络用户的兴趣主题分析与地理位置预测
发布时间:2020-07-24 07:57
【摘要】:随着社会发展,人类的信息传播活动越来越明显地展示出分众特征,对用户的细致分类及预测成为信息传播领域一个重要的研究课题。在社会网络中,快速准确地对用户进行分类,寻找相似的在线社会网络用户,预测受众地理位置,对理解用户特点、改善用户体验、提高信息传播效果等方面都具有重要的意义。本文研究用户兴趣主题分类、多属性综合相似用户查找、视频受众地理位置预测,具体内容如下:(1)提出了三种对微博用户进行分类的方法。①提出了基于信息内容对微博用户进行分类的方法,首先使用LDA主题模型从信息内容中提取每个用户的主题分布作为特征值,然后采用支持向量机等模型对用户进行分类。②提出了基于粉丝拓扑关系对用户分类的方法,首先依据我们所发现的具有相同兴趣主题的用户倾向于拥有共同粉丝这一关系,使用平均值法从粉丝交集中提取每个用户的特征值,然后采用支持向量机等模型进行分类。③提出了比较概率估计值和合并特征值两种综合方法,用这两种综合方法把上述基于信息内容分类方法和基于粉丝拓扑关系分类方法的结果综合起来,得到更准确的分类结果。(2)提出基于直觉模糊集发现兴趣、行为、个人信息等多个属性综合相似的用户的方法。首先根据两个用户的某个属性的差值,通过计算相似度和差异度,构造出表示这个属性相似程度的一个直觉模糊数。然后采用集成算子,根据每个属性分别对应的直觉模糊数,计算得到表示多个属性综合相似程度的直觉模糊数。最后对每个表示综合相似程度的直觉模糊数,计算出它的得分值和精确度,并进行排序。多个属性综合相似的用户就是与得分值和精确度排名靠前者相对应的用户。(3)提出了基于k近邻多标签分类的在线视频受众位置预测方法。首先把受众位置预测转换为多标签分类问题,在线视频受众位置预测即是预测视频最受欢迎的地区排名,把在线视频看作样本,把受众地区看作标签,则受众位置预测问题即看成多标签分类问题。然后对经典的k近邻多标签分类方法ML-KNN进行了两点改进:①引入基于权重的样本相似度测量方法,并给出了计算特征权重的方法;②设计了快速查找相似样本的算法,提高了查找速度。在此基础上,提出基于k近邻多标签分类的受众位置预测方法AL-KNN。这三部分的研究内容,都使用了大规模的数据对研究的结果进行了验证:对用户兴趣分类和相似用户查找,使用了最具影响力的微博网络Twitter的数据进行实验验证;对视频受众位置预测,使用了最流行的在线视频分享网络Youtube的数据进行实验验证。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1;G206
【图文】:
2013年底,美国科技博客Business邋Insider对全球最为流行的在线社会网络逡逑做了统计分析,排名最前面的15个在线社会网络站点的月度活跃用户数量都超逡逑过了邋1亿⑴,如图1-1所示。其中,用户量最大的Facebook月度活跃用户人数达逡逑到了邋11.5亿,紧跟其后的YouTube月度活跃用户人数为10亿人,新浪微博和逡逑twitter分别为5亿和2亿。可以说,仅仅从用户数量看,在线社会网络也是人们逡逑不可忽视的领域,更不用说它还从速度、信息容量和形式上改变了人们的社交方逡逑式,对社会经济、政治和文化产生了巨大的影响。逡逑Largest邋Social邋Networks邋In邋The邋World逡逑Monthfy邋Active邋Users邋(Unless邋Noini邋Otherwfse}逡逑ym逡逑US9邋..:u?逡逑l.QOd逡逑103&逡逑Br邋iNTELLfGENCK逡逑:i邋.逡逑too逡逑.Ill逡逑图1-1在线社会网络用户数量统计逡逑1.1.2在线社会网络用户特征分析逡逑在线社会网络为人们提供了各种便捷的生活方式,最重要的是,比起社会网逡逑络中社会关系的维持,建立和保持在线社会网络中的人际联系所需要的时间和精逡逑力要少的多,在这里,人们更倾向于保持一个更为广泛的社会关系网络。因此,逡逑这个体系也就拥有了越来越多的人的参与
图1-2研究内容的结构图逡逑论文的组织逡逑文共分为六个章节。逡逑一章为绪论,主要介绍本文选题的研究背景、动机、主要研究内容安排。逡逑二章对本文所涉及的国内外相关工作进行介绍,给出了用户兴趣用户、受众位置预测等所涉及的研究领域的相关工作,以及介绍相识构成了本文的研宄基础。逡逑三章首先基于信息内容对用户按兴趣进行分类,然后分析用户兴扑关系,并基于这一分析对用户按兴趣进行分类,最后综合信息内关系对用户进行分类。逡逑四章首先提出确定每种属性的直觉模糊数的方法,然后给出基于
MySpace中用户的宗教、国家、年龄等方面都表现出了明显的同质性。我们依据逡逑这些研究所得出的结果,假设微博中粉丝关系与其兴趣偏好之间与存在同质性,逡逑即具有相同兴趣的用户倾向于拥有共同的粉丝。图3-1显示了粉丝一致性假设的逡逑示例,节点al和a2为同一兴趣类别的用户,节点bl和cl为另外两种不同兴_邋.逡逑类别的用户,节点fl到f9为粉丝用户,两个节点间的有向箭头表示粉丝关系广逡逑例如节点al和fl之间存在指向fl的箭头表明fl为al的粉丝。在图中实例即表逡逑现出了粉丝一致性假设,即因为用户al和a2具有共同的兴趣类别,所以他们的逡逑共同粉丝数量较多,包括f3、f5、f6和f7四个共同粉丝。而al和bl因为具有逡逑不同的兴趣类别,所以他们的共同粉丝数量较少,包括fl和f4两个共同粉丝,逡逑同时另外三组al和cl、a2和bl以及a2和cl同样因为属于不同的兴趣类别,逡逑所以粉丝数量较小,其值小于等于2,明显小于属于同一兴趣类别的al和a2的逡逑共同粉丝数量。逡逑33逡逑
本文编号:2768545
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.1;G206
【图文】:
2013年底,美国科技博客Business邋Insider对全球最为流行的在线社会网络逡逑做了统计分析,排名最前面的15个在线社会网络站点的月度活跃用户数量都超逡逑过了邋1亿⑴,如图1-1所示。其中,用户量最大的Facebook月度活跃用户人数达逡逑到了邋11.5亿,紧跟其后的YouTube月度活跃用户人数为10亿人,新浪微博和逡逑twitter分别为5亿和2亿。可以说,仅仅从用户数量看,在线社会网络也是人们逡逑不可忽视的领域,更不用说它还从速度、信息容量和形式上改变了人们的社交方逡逑式,对社会经济、政治和文化产生了巨大的影响。逡逑Largest邋Social邋Networks邋In邋The邋World逡逑Monthfy邋Active邋Users邋(Unless邋Noini邋Otherwfse}逡逑ym逡逑US9邋..:u?逡逑l.QOd逡逑103&逡逑Br邋iNTELLfGENCK逡逑:i邋.逡逑too逡逑.Ill逡逑图1-1在线社会网络用户数量统计逡逑1.1.2在线社会网络用户特征分析逡逑在线社会网络为人们提供了各种便捷的生活方式,最重要的是,比起社会网逡逑络中社会关系的维持,建立和保持在线社会网络中的人际联系所需要的时间和精逡逑力要少的多,在这里,人们更倾向于保持一个更为广泛的社会关系网络。因此,逡逑这个体系也就拥有了越来越多的人的参与
图1-2研究内容的结构图逡逑论文的组织逡逑文共分为六个章节。逡逑一章为绪论,主要介绍本文选题的研究背景、动机、主要研究内容安排。逡逑二章对本文所涉及的国内外相关工作进行介绍,给出了用户兴趣用户、受众位置预测等所涉及的研究领域的相关工作,以及介绍相识构成了本文的研宄基础。逡逑三章首先基于信息内容对用户按兴趣进行分类,然后分析用户兴扑关系,并基于这一分析对用户按兴趣进行分类,最后综合信息内关系对用户进行分类。逡逑四章首先提出确定每种属性的直觉模糊数的方法,然后给出基于
MySpace中用户的宗教、国家、年龄等方面都表现出了明显的同质性。我们依据逡逑这些研究所得出的结果,假设微博中粉丝关系与其兴趣偏好之间与存在同质性,逡逑即具有相同兴趣的用户倾向于拥有共同的粉丝。图3-1显示了粉丝一致性假设的逡逑示例,节点al和a2为同一兴趣类别的用户,节点bl和cl为另外两种不同兴_邋.逡逑类别的用户,节点fl到f9为粉丝用户,两个节点间的有向箭头表示粉丝关系广逡逑例如节点al和fl之间存在指向fl的箭头表明fl为al的粉丝。在图中实例即表逡逑现出了粉丝一致性假设,即因为用户al和a2具有共同的兴趣类别,所以他们的逡逑共同粉丝数量较多,包括f3、f5、f6和f7四个共同粉丝。而al和bl因为具有逡逑不同的兴趣类别,所以他们的共同粉丝数量较少,包括fl和f4两个共同粉丝,逡逑同时另外三组al和cl、a2和bl以及a2和cl同样因为属于不同的兴趣类别,逡逑所以粉丝数量较小,其值小于等于2,明显小于属于同一兴趣类别的al和a2的逡逑共同粉丝数量。逡逑33逡逑
【参考文献】
相关期刊论文 前6条
1 葛红美;何炎祥;陈强;徐超;;一种基于时间片的微博用户分类方法[J];小型微型计算机系统;2013年11期
2 李思男;李宁;李战怀;;多标签数据挖掘技术:研究综述[J];计算机科学;2013年04期
3 周雒维;管春;卢伟国;;多标签分类法在电能质量复合扰动分类中的应用[J];中国电机工程学报;2011年04期
4 龚艳冰;丁德臣;何建敏;;一种基于直觉模糊集相似度的多属性决策方法[J];控制与决策;2009年09期
5 姜远;佘俏俏;黎铭;周志华;;一种直推式多标记文档分类方法[J];计算机研究与发展;2008年11期
6 李凡,徐章艳;Vague集之间的相似度量[J];软件学报;2001年06期
本文编号:2768545
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2768545.html