模式无关的社交网络用户识别算法
本文选题:用户识别 切入点:二部图 出处:《西安交通大学学报》2013年12期
【摘要】:针对识别社交网络用户时存在的模式不一致问题,提出了基于分块和二部图的用户识别算法。该算法通过将传统分块算法中的属性值精确匹配扩展为无模式信息下的属性值近似匹配,避免了传统用户识别时所需的模式对齐;使用加权二部图及Kuhn Munkres(KM)最大权匹配算法进行源用户档案与待匹配用户档案间的相似度计算,解决了用户档案间属性个数不同及语义语法异构的问题。在社交网站Profilactic上采集了965个用户的公开数据,采用召回率、精确率和综合指标等评价指标对算法进行了实验评估。实验结果表明,所提算法能够不依赖模式信息进行实例级跨系统用户识别,与基于属性值精确匹配的算法相比,所提算法的召回率提高了6.2%~9.5%,综合评价指标提高了3%~4.2%。
[Abstract]:In order to solve the problem of pattern inconsistency in the identification of social network users, a user identification algorithm based on block and bipartite graph is proposed.By extending the exact matching of attribute values in the traditional block algorithm to approximate matching of attribute values without schema information, the proposed algorithm avoids the pattern alignment required by traditional user identification.By using weighted bipartite graph and Kuhn Munkres KM) maximum weight matching algorithm, the similarity between the source user file and the user file to be matched is calculated, which solves the problem of different number of attributes and heterogeneous semantic syntax among user files.The public data of 965 users were collected on the social network Profilactic. The algorithm was evaluated experimentally by using the evaluation indexes such as recall rate, precision rate and comprehensive index.The experimental results show that the proposed algorithm can recognize cross-system users without depending on the pattern information. Compared with the algorithm based on the exact matching of attribute values, the recall rate of the proposed algorithm is increased by 6.2and 9.5. the comprehensive evaluation index is increased by 34.2.
【作者单位】: 西安交通大学电子与信息工程学院;西安建筑科技大学信息与控制工程学院;陕西电力信通有限公司;
【基金】:国家自然科学基金资助项目(61272458) 陕西省自然科学基础研究计划资助项目(2013JM8021) 西安建筑科技大学青年基金资助项目(2013JK1189)
【分类号】:TP393.09
【相似文献】
相关期刊论文 前10条
1 孙名松;王艳丽;唐亮;;一种改进的Web日志数据预处理研究[J];自动化技术与应用;2008年03期
2 贾丙静;吴长勤;王传安;葛华;;Web日志预处理技术探析[J];电脑知识与技术;2011年10期
3 包敬海;;金融危机下门户网站个性化服务的研究[J];重庆工商大学学报(自然科学版);2010年02期
4 靳风荣,郑雪峰;Web日志挖掘的预处理过程及算法[J];微型电脑应用;2004年06期
5 邹根;闻立杰;;基于支持向量机的Web日志用户标志修正算法[J];计算机集成制造系统;2011年08期
6 刘洪涛,张平,黄智兴,程静,刘革平;用户浏览行为数据采集方法综述[J];西南科技大学学报;2004年02期
7 王听忠;王辉;武新梅;;基于协同推荐的web日志预处理过程[J];微计算机信息;2006年03期
8 李煊,庄镇泉;Web访问挖掘预处理的用户识别算法[J];计算机工程与应用;2002年07期
9 胡海星;;搜寻恐怖分子题解——2002年第11期题解[J];程序员;2003年01期
10 卢喜利;周军;周月鹏;;基于Cookie技术和启发式规则的用户识别算法[J];微计算机应用;2009年11期
相关会议论文 前7条
1 童建刚;;计算机用户识别技术[A];第三次全国计算机安全技术交流会论文集[C];1988年
2 沈卫超;宋成久;;关于对抗拒绝服务攻击的几个方法[A];第十七次全国计算机安全学术交流会暨电子政务安全研讨会论文集[C];2002年
3 周有根;;计算机通信网的保密[A];第三次全国计算机安全技术交流会论文集[C];1988年
4 乔东海;;计算机网络系统的安全保护[A];第二次计算机安全技术交流会论文集[C];1987年
5 刘凯鹏;方滨兴;;一种基于社会性标注的网页排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
6 吴珊;杨桦;;基于日志挖掘的Web预取模型[A];2006年电气工程教育专业委员会年会论文集[C];2006年
7 蔡猷花;张岐山;;Web日志挖掘及其在电子商务领域的应用[A];第10届计算机模拟与信息技术会议论文集[C];2005年
相关重要报纸文章 前9条
1 赵慧玲 吴江;VPN放心用[N];中国计算机报;2001年
2 容旭;魔高一尺 道高一丈[N];中国电脑教育报;2003年
3 李磬;移动支付安全闯关[N];计算机世界;2005年
4 ;真金也要火炼[N];网络世界;2006年
5 ;青岛电信宽带IP城域网(四)[N];通信产业报;2002年
6 Jerry Iwanski邋 Route1公司首席技术官;智能卡结合PKI比限制访问更安全[N];计算机世界;2007年
7 北电网络;青岛电信宽带IP城域网分析[N];计算机世界;2002年
8 斯伦贝谢技术(亚洲)有限公司 杨凯莉;SIM卡与WAP应用的配合——WIM卡[N];中国电子报;2000年
9 ;基于网络的IP VPN的安全要求[N];人民邮电;2001年
相关博士学位论文 前1条
1 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
相关硕士学位论文 前10条
1 王善民;电子商务网站用户跟踪与访问数据分析研究[D];吉林大学;2009年
2 陈晓萍;一种新的基于用户识别的图形口令机制的设计与实现[D];西安电子科技大学;2009年
3 陈步桥;民航公众信息服务平台中基于BPEL的动态服务组合研究与实现[D];南京航空航天大学;2010年
4 苑昆峰;面向Web个性化服务的网页分类技术[D];重庆大学;2007年
5 马相华;基于访问日志的自适应站点的研究[D];大连海事大学;2008年
6 沈婧;综合风险智能主题推送技术的研究与应用[D];西北大学;2008年
7 朱晋华;WEB日志用户会话识别及聚类分析研究[D];太原理工大学;2008年
8 刘丽娜;基于Web日志挖掘的推荐系统的研究与实现[D];东北师范大学;2008年
9 王蕾;基于Web日志挖掘的推荐系统研究[D];吉林大学;2008年
10 韩云端;基于浏览者的网站结构研究[D];山西财经大学;2006年
,本文编号:1725676
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1725676.html