当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户兴趣分析的网页生命周期建模

发布时间:2020-02-19 16:38
【摘要】:网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善网络广告的效果。利用一台代理服务器收集的网页访问量信息,我们对网页的生命周期进行了研究,给出了用户兴趣演变的模型。这个模型有助于更好地理解网络的组织与运行机理。
【图文】:

概率密度函数,对数正态分布,曲线,拟合图


去掉其中总访问量小于60的网页,还剩975 151个网页。用上述方法对每一个网页的访问量数据进行拟合,得到其用户兴趣曲线。图1和图2是其中两个网页的用户兴趣曲线。有的网页的访问量有多个高峰。比如报道央行加息的新闻的网页在诞生之初会吸引到很多用户,然后用户减少。到了下次加息时,很多用户想查阅以前加息时的情况,这个网页又能够吸引到比较多的用户。但在本文中,我们主要关注网页在几周或者几个月内的生命状态。在这样比较短的时间内,用户兴趣一般不会有多个高峰。对数正态分布的概率密度函数足够描述没有或者只有一个高峰的用户兴趣。4 区分有时效性的网页和无时效性的网页如图1、图2所示,有的网页的用户兴趣有明显的上升和下降,另外一些网页的用户兴趣保持相对恒定。网页可以以此分为有时效性的网页和无时效性的网页两类。这两类网页的定义如下:有时效性的网页:用户兴趣随时间变化的网页。这类网页的内容是有时效性的

概率密度函数,对数正态分布,曲线,拟合图


去掉其中总访问量小于60的网页,还剩975 151个网页。用上述方法对每一个网页的访问量数据进行拟合,得到其用户兴趣曲线。图1和图2是其中两个网页的用户兴趣曲线。有的网页的访问量有多个高峰。比如报道央行加息的新闻的网页在诞生之初会吸引到很多用户,然后用户减少。到了下次加息时,很多用户想查阅以前加息时的情况,这个网页又能够吸引到比较多的用户。但在本文中,我们主要关注网页在几周或者几个月内的生命状态。在这样比较短的时间内,用户兴趣一般不会有多个高峰。对数正态分布的概率密度函数足够描述没有或者只有一个高峰的用户兴趣。4 区分有时效性的网页和无时效性的网页如图1、图2所示,有的网页的用户兴趣有明显的上升和下降,另外一些网页的用户兴趣保持相对恒定。网页可以以此分为有时效性的网页和无时效性的网页两类。这两类网页的定义如下:有时效性的网页:用户兴趣随时间变化的网页。这类网页的内容是有时效性的

【相似文献】

相关期刊论文 前10条

1 王桂荣 ,张正卿;抗干扰曲线的一种算法[J];数值计算与计算机应用;1980年02期

2 ;数值计算与计算机应用第1卷1980年总目录[J];数值计算与计算机应用;1980年04期

3 杨廷郊;苏联计算机发展及应用简况[J];机器人;1980年02期

4 叶玉澄;关于算法集的一些特征[J];南昌大学学报(理科版);1980年01期

5 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期

6 ;电子技术应用——1980年1~6期总目录[J];电子技术应用;1980年06期

7 钱锋;计算语言学[J];自然杂志;1980年04期

8 平一梅;约瑟夫森器件的计算机应用[J];西北大学学报(自然科学版);1980年04期

9 ;“电子计算机工程与科学”1980年征订启事[J];计算机工程与科学;1980年01期

10 朱三元;徐元宙;;COBOL的变迁[J];计算机研究与发展;1980年06期

相关会议论文 前10条

1 刘祥官;刘芳;陆剑锋;李满喜;蔡漳平;卜敏;高贤成;程克友;;济钢350m~3高炉的炼铁优化专家系统[A];1999中国钢铁年会论文集(上)[C];1999年

2 周爱民;鲍爱华;徐必根;徐树岚;;我国有色矿山的主要技术成就与差距[A];第六届全国采矿学术会议论文集[C];1999年

3 蒋继穆;;“八五”期间重有色金属冶炼技术进展概述[A];中国有色金属学会第三届学术会议论文集——战略研究综述部分[C];1997年

4 谢放;;深覆盖层上面板堆石坝的分析计算[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年

5 高洪深;;企业管理决策支持系统及其三库系统的研究[A];企业发展与系统工程——中国系统工程学会第七届年会论文集[C];1992年

6 王菲菲;;市、县公共图书馆如何面对计算机应用新趋势[A];福建省迎接21世纪的图书馆服务学术研讨会论文集[C];1998年

7 林士敏;;普及CAI知识 培养跨世纪人才——CAI课程开设五年回顾[A];广西高等教育改革与发展——《广西高教研究》创刊十周年(1985-1995)论文选集[C];1996年

8 李正仁;;在桥梁工程中计算机应用的几点展望[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年

9 程军;胡怡;;走向多元化发展的21世纪计算机[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年

10 黄东;郑邦民;黄昕;;明渠非恒定流数值模拟中的计算机应用初探[A];中国土木工程学会计算机应用分会第七届年会论文集[C];1999年

相关重要报纸文章 前10条

1 伊凡;计算机应用上新台阶[N];中国船舶报;2000年

2 王周文;汉字学教育学专家关注小学识字教学[N];中国教育报;2000年

3 柯技;IT产业推动经济结构调整[N];中国矿业报;2000年

4 陈文;IBM开发出五个原子的量子计算机[N];光明日报;2000年

5 ;形形色色的中文输入法[N];中国信息报;2000年

6 张长明;语言:人类文明的标志[N];安徽日报;2001年

7 李健;反病毒软件:抢占市场突破口[N];中国电力报;2001年

8 刘萍;我国中文信息处理技术达到新水平[N];中国电子报;2001年

9 本报记者 梁曦 特约记者 杨蓉 董万森;托起国际工程的平台[N];中国化工报;2001年

10 国家标准化管理委员会主任助理 宿忠民;加快标准化步伐 促进高新技术产业发展[N];中国国门时报(中国出入境检验疫报);2001年

相关博士学位论文 前10条

1 姜梅;基于生物免疫系统的计算机入侵检测技术研究[D];南京航空航天大学;2001年

2 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年

3 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年

4 涂蓉;肝CT图像分析的临床与计算机应用研究[D];中南大学;2004年

5 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年

6 刘杰;泄漏发射的信息重建与防御对策[D];浙江大学;2004年

7 陈守强;丁书文教授用药规律的计算机辅助分析[D];山东中医药大学;2005年

8 Memon Abdul Ghafoor;[D];浙江大学;2006年

9 单大卯;人体下肢肌肉功能模型及其应用的研究[D];上海体育学院;2003年

10 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年

相关硕士学位论文 前10条

1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年

2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年

3 胡光源;Windows环境下动画制作系统[D];大连理工大学;2000年

4 陈瑞丹;面向企业信息系统的可适应性建模研究与应用[D];大连理工大学;2000年

5 郭卉萍;基于Java的网络中文平台的研究与实现[D];西安电子科技大学;2001年

6 吴传喜;一种面向Internet的中文应用支撑平台的研究与实现[D];西安电子科技大学;2001年

7 刘宏;基于Web的自主学习远程教学系统[D];辽宁师范大学;2001年

8 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年

9 程丽芳;基于Ada95的语言识别器生成器的研究[D];西安电子科技大学;2001年

10 张驰;Web信息获取技术研究与实现[D];西北工业大学;2001年



本文编号:2581067

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2581067.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e905a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com