基于超链接多样性分析的新型网页排名算法
本文关键词:基于超链接多样性分析的新型网页排名算法,由笔耕文化传播整理发布。
第37卷 第4期2014年4月
计 算 机 学 报
CHINESEJOURNALOFCOMPUTERS
Vol.37No.4
Ar.2014p
基于超链接多样性分析的新型网页排名算法
杨
博
,1)2)
陈贺昌
,1)2)
朱冠宇 赵学华
)30012 长春 1
3),1)2)
)30012 长春 1
2)()符号计算与知识工程教育部重点实验室(吉林大学)30012 长春 1
3)(吉林大学软件学院
1)(吉林大学计算机科学与技术学院
摘 要 作为搜索引擎的核心部件,网页排名算法决定了搜索到的相关结果以何种顺序呈现给用户,,其性能的优劣将会直接影响搜索引擎的服务质量和用户的搜索体验.在计算网页的权威性时,现有的基于链接的网页排名算——另一种客观评价网页而忽略了超链接来源的多样性—法和网页作弊检测算法仅关注网页的超链接数量和质量,
,权威性的重要信息.相比于真正的权威页面(具有大量且来源广泛的入链)通过作弊手段提升排名的网页往往不具有入链来源多样性的特征.基于以上思想,文中分别提出了超链接来源多样性判断方法、超链接权值调整方法,进而提出了基于超链接来源多样性分析的网页排名算法D在多个基准数据集上的实验结果表明:与现有最好rank.的同类算法相比,综合寻找优质页面和抑制网页排名作弊两方面,Drank算法表现出更好的性能.关键词 搜索引擎;排名算法;作弊检测;链接分析;概率计数;社会计算;社交网络/中图法分类号TP393 DOI号10.3724SP.J.1016.2014.00833
ANovelPaeRankinAlorithmBasedonAnalzinthe gggyg
DiversitofInboundHerlinks yyp
1
YANGBo
1)(
),2)
1
N He-Chan CHEg
),2)
31
HU GuanuHAOXue-Hua Z-Y Z
)),2)
)ColleeoComuterScienceand TechnoloJilin UniversitChanchun 130012 gf pgy,y,g
2)(,M)KeLaboratoroSmbolicComutationand KnowledeEnineer(Jilin UniversitinistroEducation,Chanchun 130012 y yf ypggy)yf g
)3()ColleeoSotware,Jilin UniversitChanchun 130012 gf fy,g
,Abstractsthecorecomonentofasearchenineaerankinalorithmdeterminesinwhat A pgpggg
orderresentederformancethesearchresultsshouldbetousersanditswilldirectlinfluence ppy
’ualitaesearchserviceanduserssearchexerience.Theexistinmethodsofrankinand qypgpgg ,samdetectionmerelconsiderthenumberandtheofinboundherlinkswhileinorinualit pyypggqy
,diversitanotherimortantcriteriontoobectivelevaluatetheauthoritofwebaes.their ypjyypg
,wComaredwithrealauthoritaeshichhasalarenumberinboundherlinksfromawide pypggyp ,’varietofsourcestheaeswhoseranksareimrovedbcheatinmethodsoftendonthavethe pgpygy
,wcharacteristicofwidediversitoftheirinboundherlinks.Basedonaforementionedideae yyp amethodtocomutethediversitofinboundherlinksandamethodtouantitativelroose pyypqypp
,adustrooseaetheweihtsofherlinksbasedonitresectivel.Thenweanovelrank jpppggyppy
,walorithm,calledDrankhichranksbasedonthediversitanalsisofinboundherlinks.aes gpgyyyp OurexerimentalresultsaainstseveralbenchmarkdatasetsshowthatDrankhasthebest pgintermsofbothfindinhihandsuressinwebsams.erformanceualitaes -q ggppgppypg
;;;;;robabilisticKewordsearcheninerankinsamdetectionherlinkanalsiscountin s ggpypypgy
;socialcomutinsocialnetwork pg
;、收稿日期:最终修改稿收到日期:本课题得到新世纪优秀人才支持计划(国家自然科学基金2013062120140124.NCET110204)------()资助.杨 博,男,教授,博士生导师,主要研究领域为数据挖掘、复杂网61133011,61373053,61300146,61170092,612023081974年生,
:络和多A陈贺昌,男,硕士研究生,研究方向为数据挖掘.朱冠宇,男,本科生,ent系统.E-mail1987年生,1990年生,bolu.edu.cn.@gyj研究方向为网页排名算法.赵学华,男,博士研究生,研究方向为数据挖掘和复杂网络.1977年生,
本文关键词:基于超链接多样性分析的新型网页排名算法,由笔耕文化传播整理发布。
本文编号:181535
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/181535.html