当前位置:主页 > 科技论文 > 搜索引擎论文 >

网络日志规模分析和用户兴趣挖掘

发布时间:2018-12-13 16:15
【摘要】:文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
[Abstract]:In this paper, the relationship between the log size and the number of users, the number of Web documents and the number of Web documents visited by unit users is studied around whether or not there are regular characteristics of user access to Web and how to utilize these characteristics. Through the user's analysis of the Web access motivation, it is concluded that the stable interest of the user is implied in the Web access log in a certain period of time; Take advantage of the user stability interest contained in the log, In this paper, a relevant document retrieval model based on user behavior and the actual retrieval performance of search engine system SISI.SISI are proposed, which are consistent with the conclusion of the analysis and retrieval model: the retrieval accuracy and retrieval time mainly depend on the number of users. The number of records returned by retrieving is mainly dependent on the number of documents.
【作者单位】: 中国科学院计算技术研究所软件研究室 中国科学院计算技术研究所软件研究室 中国科学院计算技术研究所软件研究室 中国科学院计算技术研究所软件研究室
【基金】:中国科学院计算技术研究所领域前沿青年基金(2002618024)资助
【分类号】:TP393.09

【参考文献】

相关期刊论文 前3条

1 宋擒豹,沈钧毅;Web日志的高效多能挖掘算法[J];计算机研究与发展;2001年03期

2 郭岩;基于网络用户行为的搜索引擎系统SISI[J];计算机工程;2004年16期

3 郭岩;基于网络用户行为的相关页面挖掘模型[J];微电子学与计算机;2003年05期

【共引文献】

相关期刊论文 前10条

1 章凯;李滨予;;组织环境因素影响员工创新能力的动力机制探索[J];安徽大学学报(哲学社会科学版);2012年04期

2 邱扶东,王书会;自我及其相关概念的心理学研究[J];安徽农业大学学报(社会科学版);2003年04期

3 葛明贵;健全人格的内涵及其教育[J];安徽师范大学学报(人文社会科学版);2003年04期

4 王轲;邵陆寿;;基于镜头检测的成熟期水稻图像处理算法研究[J];安徽农业大学学报;2011年06期

5 贾丙静;葛华;王传安;赵海燕;;Web日志挖掘在校园网建设中的应用研究[J];安徽科技学院学报;2010年03期

6 施明雅;艺术体操特招生培养模式的探讨[J];安徽体育科技;2001年01期

7 李用江,回雁雁;基于ADO.NET的海洋经济生物MIS系统[J];安阳师范学院学报;2004年05期

8 蔡茂蓉;;基于VRML和Java的远程虚拟教学系统[J];兵工自动化;2005年06期

9 李明俊;高校体育教学中如何发展学生的个性[J];北京工业职业技术学院学报;2005年02期

10 张辉;吴辉;刘瑞;周刚;;科技资源信息检索关键技术[J];北京航空航天大学学报;2006年09期

相关会议论文 前10条

1 蔡猷花;张岐山;;Web日志挖掘及其在电子商务领域的应用[A];第10届计算机模拟与信息技术会议论文集[C];2005年

2 来旭;李国辉;徐蕊;;基于云图和雨量的关联规则挖掘[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 王怡;;论网络时代青少年思想政治教育之职责[A];江西省语言学会2007年年会论文集[C];2007年

4 雷三丫;刘庆敖;;数据挖掘在数字化图书馆个性化服务中的应用[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年

5 李琳;;10~24岁男女学生的神经系统特性研究[A];第8届全国运动心理学学术会议论文汇编[C];2006年

6 魏新;廖闻剑;彭艳兵;;基于数据挖掘的校园网络行为分析[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年

7 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

8 赵秉岩;邓长寿;郭景峰;杨焱林;;基于Markov链的电子商务网站频繁访问路径的发现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

9 康海燕;樊孝忠;马礼;;自然语言理解的检索技术在数字图书馆中的应用[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

10 刘广艳;孙莹;黄保海;林培光;;基于本体方法的改进VSM语义检索模型[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

相关博士学位论文 前10条

1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年

2 张敏;思想政治教育视域下大学生精神成人研究[D];陕西师范大学;2011年

3 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年

4 曹海艳;顿河哥萨克的群体精神真理探寻与历史悲剧[D];黑龙江大学;2011年

5 彭海蕾;幼儿园游戏教学研究[D];西北师范大学;2002年

6 丁彪;企业领导者自主学习能力的实证研究[D];华东师范大学;2002年

7 何见得;人才资源开发有效对策基础理论研究[D];河海大学;2002年

8 杨慧芳;女性犯罪者的人格、应付方式、情境因素与犯罪行为的研究[D];华东师范大学;2003年

9 杨秀君;学习成功感研究[D];华东师范大学;2004年

10 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年

相关硕士学位论文 前10条

1 魏雪猛;我国优秀女子散打运动员个性心理特征调查与研究[D];上海体育学院;2010年

2 徐晓妹;小学音乐教育应把握儿童心理发展[D];辽宁师范大学;2010年

3 计敏;烟台开发区高级中学思想政治课学生选课指导的行动研究[D];华东师范大学;2010年

4 杨洋;企业内容管理系统的设计与实现[D];电子科技大学;2010年

5 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年

6 奚杰;基于WEB日志的用户行为分析与挖掘[D];东华大学;2011年

7 吴金桥;XML及关联规则在Web日志挖掘中的应用研究[D];东华大学;2011年

8 马爽;数据挖掘技术在WMS系统中的应用研究[D];北方工业大学;2011年

9 安阳;心理学在自由心证中的作用[D];吉林大学;2011年

10 桂辉;WEB日志挖掘在网站推荐服务中的应用研究[D];华北电力大学(北京);2011年

【二级参考文献】

相关期刊论文 前1条

1 郭岩;基于网络用户行为的相关页面挖掘模型[J];微电子学与计算机;2003年05期

【相似文献】

相关期刊论文 前10条

1 王攀;张顺颐;陈雪娇;;基于DBP的Web用户行为分析关键技术[J];电信快报;2008年08期

2 王继民;彭波;;搜索引擎用户点击行为分析[J];情报学报;2006年02期

3 潘雁钦;;基于情境模式的个性化搜索初探[J];内蒙古科技与经济;2011年15期

4 蔡岳;袁津生;;用户行为聚类的搜索引擎算法与实现[J];计算机系统应用;2010年04期

5 欧阳秀平;王攀;饶翔;;基于业务智能感知和行为分析引擎的用户行为分析模型[J];电信快报;2008年10期

6 黄清芬;搜索引擎的用户跟踪功能分析[J];情报杂志;2004年03期

7 李翠霞;谭莹军;;关于Web日志挖掘的研究[J];安阳工学院学报;2007年01期

8 周莉娜;;网络用户搜索引擎使用行为及其评价的调研与分析[J];广州城市职业学院学报;2010年03期

9 陈晓云;莫明辉;李廉;赵燕;;基于网络日志分析的混合策略主题爬虫[J];微计算机信息;2009年03期

10 陈小莉;;基于用户行为个性化学习研究[J];电脑知识与技术;2009年10期

相关会议论文 前10条

1 郭岩;白硕;张凯;;网络日志规模分析和用户对Web的访问动机分析[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

2 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的网络搜索引擎用户行为研究[A];第三届学生计算语言学研讨会论文集[C];2006年

3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

6 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

7 刘宝良;李建中;张兆功;;基于用户行为的搜索引擎结果过滤及合并方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

8 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年

10 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

相关重要报纸文章 前10条

1 记者 陈炳欣/北京;Google涉足企业搜索第三代搜索引擎更近一步[N];电子资讯时报;2005年

2 实习生 瞿艳花;搜索引擎网络摇钱树[N];上海金融报;2006年

3 金朝力;搜索盛世将告别虚假繁荣?[N];北京现代商报;2005年

4 林嘉澍;Google:0.2秒和80亿张网页[N];经济观察报;2006年

5 艾瑞咨询 分析师 田欣;受宏观因素影响 08Q1中国搜索引擎市场规模缩水4.7%[N];中国联合商报;2008年

6 刘凯;门户搜索合作:还是靠流量[N];21世纪经济报道;2007年

7 艾瑞;视频搜索潜力巨大 搜索引擎抢得先机[N];中华新闻报;2008年

8 李一鑫;搜索排名的红与黑[N];财经时报;2007年

9 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年

10 李永胜;新搜索要革Google的命?[N];中国计算机报;2006年

相关博士学位论文 前10条

1 陈亚睿;云计算环境下用户行为认证与安全控制研究[D];北京科技大学;2012年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

5 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年

6 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

7 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

8 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

9 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

10 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

相关硕士学位论文 前10条

1 刘凯;企业搜索引擎营销效果评估体系之研究[D];华东师范大学;2007年

2 陈都;基于用户行为的智能搜索研究[D];华北电力大学(北京);2008年

3 陈刚;基于行为分析智能推荐购物搜索引擎的设计与实现[D];北京交通大学;2011年

4 苏国荣;校园网搜索引擎排序的去重方法研究[D];国防科学技术大学;2010年

5 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

6 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

7 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

8 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

9 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

10 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年



本文编号:2376828

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2376828.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eef63***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com