基于日志挖掘的搜索引擎用户行为分析
本文关键词:基于日志挖掘的搜索引擎用户行为分析,由笔耕文化传播整理发布。
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查
第 2卷 4
第 3期
中文信息学报 J OURNAL OF CH I S NF NE E I oRM ATI ON RoCES I P S NG
Vo .2,No 1 4 .3 M ay,201 0
21 0 0年 5月
文章编号:1 0 - 0 7 2 1 ) 3 0 4— 6 0 3 0 7 ( 0 0 0~ 0 90
基于日志掘的搜索引擎用户行为分析挖 岑荣伟,奕群,敏,立云,少平刘张茹马 (能技术与系统国家重点实验室,华信息科学与技术国家实验室 ( )清华大学计算机科学与技术系,京 1 08 )智清筹,北 0 0 4 摘要:着网络搜索用户的大规模增加,随网络用户行为分析已成为网络信息检索系统进行架构分析、能优化和性系统维护的重要基石,网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,文是该
基于 75 . 6亿条真实网络用户行为日志,用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长对度、询修改率、关搜索点击率、次/查相首最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同 类型的查询集合,察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都考
具有一定的参考意义。 关键词:算机应用;文信息处理;户行为分析;索引擎;计中用搜网络信息检索 中图分类号:TP 9 31文献标识码:A
S a c g n e h vo a y i s d O g M i n e r h En i e Us r Be a i r An l ssBa e n Lo ni g CEN n we,L1 Yi n,ZH A NG i Ro g i U qu M n,RU y n,M A ha p n Li u S o ig ( a e K e b a or nt li ntTe hn o n s e s,T sn St t y La or t y ofI elge c olgy a d Sy t m ighu a i a a N ton lLab a or orI o mato inc or t y f nf r in Sce e
a d Te h oo y n c n lg,De a t n fC mp trS in ea dTe h oo y,Ts g u iest p r
me to o ue ce c n c n lg i h aUnv r i n y,B in 0 0 4,Chn ) ej g 1 0 8 i ia A b t a t W ih t e gr sr c: t h owt n a ou e r h us r hi m ntofs a c e s,t h vi nayss h c e o h os m p t nt he be a ora l i asbe om ne oft e m t i ora r s ar h isu s f e c ng n s n t r s ofa c ie t e a l ss, pe f m a c ptm ia i nd s s e e e c s e or s ar h e i e i e m r h t c ur na y i ror n e o i z ton a y t m mai e nt—
n n e I i as j rae nb t no mainr tiv l n n wld ema a e n .I r e ob te n esa d a e. t s loamao rai ohif r to ere a dk o e g n g me t no d rt etru d rtn a s a c e a i r o b u e s e r h b h v o fwe s r,we a a y e b u e e a ir a e n 7 mi i n e t is o l k t r u h l g . n l z d we s r b h v o s b s d o 6 5 l o n r fc i—h o g o s l e c S v r l mp r a t a p c so s r b h vo s a e s u id,s c sq e y l n t e e a i o t n s e t fu e e a i r r t d e u h a u r e g h,r to o u r e i i g u r e o a i fq e y r f n,q e y r c m— n
me d t n a c s,frt ls l k dsrb to n ai c e s is/a tci itiuin,cik n mb ri u r o c l u e q ey,e 1 c n t .Weas n lzd tedfee c si sr a loa ay e h ifrn e nu e be a o o ifr nti or a i e dsba e e r t e y s t. The e a l s sm a e p i pr v t fe— h vir f r d fe e nf m ton n e s d on s pa
a e qu r e s s na y e y h l m o e bo h e fc tve s nd e fce c fs a c ngi s i ne sa fi in y o e r h e ne .
Ke r s o u e p l ai n;C i e e i f r to r c s i g;u e e a ira ay i;s a c n i e y wo d:c mp t r p i to a c h n s n o ma i n p o e sn s rb h v o n l ss e r h e g n;we n o~ b i f r m a i e re al ton r t jv
网络用户提供优质的搜索服务,助用户定位所需帮
引言 作为当前网络信息检索的主要工具,索引擎搜已成为人们访问互联网资源的有效手段。据最新 C NNI C统计报告显示Ⅲ,止 2 0截 0 9年底,国网民中规模已达 3 8 . 4亿人,中搜索引擎的使用率为其
的网络目标资源,最大规模的吸引客户使用,直是一 商用搜索引擎公司所关注的重点。网络用户行为分析是认识用户意图和了解用户兴趣的主要方法之 一
,
受到了研究界和产业界的广泛关注,已成为网络 搜索引擎日志记录着用户和搜索引擎交互的相
信息检索和知识挖掘的重要研究领域之一。 关行为信息,是研究和分析真实网络用户行为的主
7 ., 3 3即搜索引擎用户规模达到 2 8 . 1亿。如何向 收稿日期: 0 9 0 2定稿日期: 0 0 0—7 2 0—91 2 1~ 12
基金项目:国家自然科学基金项目资助 (0 30 4 69 30 )高等学校博士学科点专项科研基金资助 (O 9O 22 O5 6 76 4,00 17; 2 OO O1 O0 ) 作者简介:荣伟 (9 2 )男,士生,要研究方向是信息检索,器学习;奕群 ( 9 1 )男,士,师,要研究岑 18一,博主机刘 18-,博讲主 方向为信息检索;敏 ( 9 7 )女,士,教授,,要研究方向为机器学习,息检索。张 17一,博副主信
本文关键词:基于日志挖掘的搜索引擎用户行为分析,由笔耕文化传播整理发布。
本文编号:90310
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/90310.html