当前位置:主页 > 科技论文 > 软件论文 >

基于微博的用户相似度计算研究

发布时间:2019-05-26 21:02
【摘要】:针对传统的相似度计算方法和评价标准在准确、高效地度量微博用户相似关系时不理想的缺陷,提出一种新的微博用户相似度的计算方法。该方法针对不同的属性数据结构采用不同的计算方式,并根据属性统计信息对各个属性赋值,利用层次分析法确定各属性权值,最后构建综合相似度计算模型。实验结果表明,相对于传统的相似度计算方法,所提计算方法衡量用户相似的准确度提高了22.6%,召回率提高了12.7%,F1度量值提高了29.5%。
[Abstract]:Aiming at the defect that the traditional similarity calculation method and evaluation standard are not ideal when measuring the similarity relationship of Weibo users accurately and efficiently, a new method for calculating the similarity of Weibo users is proposed. According to the different attribute data structure, the method adopts different calculation methods, and according to the attribute statistical information, determines the weight of each attribute by AHP, and finally constructs the comprehensive similarity calculation model. The experimental results show that compared with the traditional similarity calculation method, the accuracy of the proposed method is increased by 22.6%, the recall rate is increased by 12.7%, and the F1 metric value is increased by 29.5%.
【作者单位】: 郑州大学信息工程学院;
【基金】:郑州大学新媒体公共传播学科招标课题(XMTGGCBJSZ05) 河南省科技攻关项目(144300510007) 郑州市科技攻关计划项目(141PPTGG368)资助
【分类号】:TP391.1

【参考文献】

相关期刊论文 前8条

1 李倩倩;顾基发;;用户行为驱动的在线社交网络建模[J];系统工程学报;2015年01期

2 吴树芳;徐建民;武晓波;;融合用户标签和关系的微博用户相似性度量[J];情报杂志;2014年12期

3 逯鹏;张姗姗;高庆一;;基于共同邻居的点权有限BBV模型研究[J];计算机科学;2014年04期

4 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期

5 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期

6 谢耘耕;徐颖;;微博的历史、现状与发展趋势[J];现代传播(中国传媒大学学报);2011年04期

7 郭金玉;张忠彬;孙庆云;;层次分析法的研究与应用[J];中国安全科学学报;2008年05期

8 宋峻峰,李国辉;信息检索算法评价指标的分析与改进[J];小型微型计算机系统;2003年10期

相关硕士学位论文 前1条

1 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年

【共引文献】

相关期刊论文 前10条

1 刘星;罗佳;李邦兰;贺琳;班越;;基于AHP-FEC的大型公园配套交通设施现状评价研究[J];陕西理工学院学报(自然科学版);2017年01期

2 李红鹏;汪胜华;侯俊;;基于灰色关联理论的最优充填站站址选择[J];黄金;2017年02期

3 郑志蕴;贾春园;王振飞;李钝;;基于微博的用户相似度计算研究[J];计算机科学;2017年02期

4 仲兆满;管燕;胡云;李存华;;基于背景和内容的微博用户兴趣挖掘[J];软件学报;2017年02期

5 于坤朋;吴同情;范昕然;;基于改进AHP的冲击钻孔桩施工风险评价[J];江苏水利;2017年02期

6 龚磊;许德;宋丹丹;曹明华;张进;吴家兵;;基于德尔菲法和层次分析法在洪涝灾害公共卫生风险评估中的应用[J];疾病监测;2017年01期

7 冷涛;;技术赋权与政策学习网络的转变:以微博热议PM2.5事件为例[J];电子政务;2017年01期

8 涂正浩;;基于动态权重的BIM-IPD项目管理成熟度模型研究[J];工程经济;2017年01期

9 方世建;蔡荫炎;;基于模糊综合评价模型的创业投融资体系研究——以安徽省创业孵化基地为例[J];北京航空航天大学学报(社会科学版);2017年01期

10 李聪;马丽;梁昌勇;;DFM-IA:面向B2C电子商务的多源用户兴趣数据采集机制[J];管理工程学报;2017年01期

相关硕士学位论文 前6条

1 连序全;基于Hadoop平台的视频拷贝检测研究[D];山东大学;2015年

2 吴楠;基于LDA模型的微博话题与事件检测[D];哈尔滨工业大学;2014年

3 张东霞;基于高校学生微博的网络热点发现及舆情分析研究[D];华南理工大学;2013年

4 韩晨靖;基于标题特征词密度聚类以及相似度计算的热点发现研究[D];电子科技大学;2013年

5 马雯雯;基于隐含语义分析的微博热点话题发现策略[D];重庆大学;2013年

6 沈劲枝;基于标签聚类的知识主题发现与应用研究[D];华中师范大学;2012年

【二级参考文献】

相关期刊论文 前10条

1 吴振宇;胡军;李德毅;;社会标注系统幂律特性分析[J];复杂系统与复杂性科学;2014年02期

2 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期

3 廖君华;孙克迎;钟丽霞;;一种基于时序主题模型的网络热点话题演化分析系统[J];图书情报工作;2013年09期

4 路永和;李焰锋;;改进TF-IDF算法的文本特征项权值计算方法[J];图书情报工作;2013年03期

5 文坤梅;徐帅;李瑞轩;辜希武;李玉华;;微博及中文微博信息处理研究综述[J];中文信息学报;2012年06期

6 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期

7 崔爱香;傅彦;尚明生;陈端兵;周涛;;复杂网络局部结构的涌现:共同邻居驱动网络演化[J];物理学报;2011年03期

8 周涛;汪秉宏;韩筱璞;尚明生;;社会网络分析及其在舆情和疫情防控中的应用[J];系统工程学报;2010年06期

9 郭金玉;张忠彬;孙庆云;;层次分析法在安全科学研究中的应用[J];中国安全生产科学技术;2008年02期

10 段志善;崔善强;;模糊层次分析法在机械安全评价中的应用[J];机械工业标准化与质量;2007年10期

相关硕士学位论文 前6条

1 郑希文;互联网话题演变与传播分析技术研究[D];哈尔滨工程大学;2009年

2 龚海军;网络热点话题自动发现技术研究[D];华中师范大学;2008年

3 聂坤明;基于文章主题分析的自动文摘研究[D];中国石油大学;2008年

4 姚晓娜;BBS热点话题挖掘与观点分析[D];大连海事大学;2008年

5 罗亚平;基于用户浏览行为的网络热点话题发现模型研究[D];北京邮电大学;2008年

6 周昭涛;文本聚类分析效果评价及文本表示研究[D];中国科学院研究生院(计算技术研究所);2005年

【相似文献】

相关期刊论文 前10条

1 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期

2 单建芳;刘宗田;周文;;事件相似度计算[J];小型微型计算机系统;2010年04期

3 刘文剑;郭宁;金天国;;制造资源本体的相似度计算模型[J];计算机集成制造系统;2010年11期

4 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期

5 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期

6 田卫东;强继朋;;基于问句类型的问句相似度计算[J];计算机应用研究;2014年04期

7 周凯波,冯珊,李锋;基于案例属性特征的相似度计算模型研究[J];武汉理工大学学报(信息与管理工程版);2003年01期

8 易丽萍,竹勇 ,雷小春;知网在词语相似度计算方面的应用[J];信息技术与信息化;2005年01期

9 廉站俊;吕学强;张玉杰;施水才;;基于句子相似度计算的信息抽取[J];现代图书情报技术;2007年06期

10 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期

相关会议论文 前10条

1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

4 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

5 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

6 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

10 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

相关重要报纸文章 前1条

1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年

相关博士学位论文 前4条

1 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年

2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年

3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年

4 任磊;推荐系统关键技术研究[D];华东师范大学;2012年

相关硕士学位论文 前10条

1 梁韬;中文微博新词与热点话题发现技术研究[D];湖南工业大学;2015年

2 汪建成;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年

3 唐海燕;基于全文的教育资源检索模型研究[D];四川师范大学;2015年

4 舒佳根;中文实体链接研究[D];苏州大学;2015年

5 孔行;基于主题推荐的辅助写作系统[D];哈尔滨工业大学;2015年

6 孙润志;基于语义理解的文本相似度计算研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年

7 刘敏;基于词向量的句子相似度计算及其在基于实例的机器翻译中的应用[D];北京理工大学;2015年

8 康毅;面向客服的自动问答系统关键技术研究[D];东北大学;2014年

9 吴宇浩;南海档案数字化半自动校勘中的底本推荐探讨[D];南京大学;2015年

10 吐尔逊阿依·阿不来提;小学维吾尔语文教材中的单句相似度研究[D];新疆师范大学;2015年



本文编号:2485629

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2485629.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa987***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com