当前位置:主页 > 科技论文 > 搜索引擎论文 >

Zipf定律与网络信息计量学

发布时间:2017-10-04 13:19

  本文关键词:Zipf定律与网络信息计量学


  更多相关文章: Zipf定律 Zipf指数 搜索引擎 网络信息计量学


【摘要】:作为文献计量学重要定律的Zipf定律已在许多领域得到较广泛的应用,网络信息计量学伴随着网络信息的激增而受到人们越来越大的关注。该文结合搜索结果数量的分布情况,提出了在网络信息计量学中仍然存在Zipf定律的猜想,并采用公开的词语集在几个代表性的搜索引擎中进行实验验证,证实了搜索结果数目近似服从Zipf定律的结论,其中Baidu与So搜索结果的Zipf指数为0.003。
【作者单位】: 西南交通大学信息科学与技术学院;西藏大学计算机科学系藏文信息技术研究中心;
【关键词】Zipf定律 Zipf指数 搜索引擎 网络信息计量学
【基金】:国家自然基金(61175047,61262058,61152001) 中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
【分类号】:TP391.3;G353.1
【正文快照】: 1引言自美国语言学家George Kingsley Zipf于1949年提出Zipf定律以来,Zipf定律已在信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等许多领域得到较广泛的应用,在学术界享有极高的声誉。Zipf定律描述的主要是词频和词序之间的联系,它的一种表述形式为:在自然语

【参考文献】

中国期刊全文数据库 前10条

1 李玉擰,肖创柏;蛋白质序列中可能存在的Zipf定律[J];北京工业大学学报;2005年04期

2 王洋;刘宇凡;陈清华;;汉语言文学作品中词频的Zipf分布[J];北京师范大学学报(自然科学版);2009年04期

3 曹盼盼;阎春宁;;人类通信模式的幂律分布和Zipf定律[J];复杂系统与复杂性科学;2009年04期

4 韩定定,马余刚;原子核碎裂中可能存在Zipf定律[J];科学通报;2000年09期

5 王德进 ,张社英 ,刘源;汉语言的几个统计规律[J];中文信息学报;1987年04期

6 游荣彦;Zipf定律与汉字字频分布[J];中文信息学报;2000年03期

7 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的搜索引擎用户行为分析[J];中文信息学报;2007年01期

8 郑亚斌;刘知远;孙茂松;;中文歌词的统计特征及其检索应用[J];中文信息学报;2007年05期

9 李静静;闫宏飞;;中文网页信息检索测试集的构建、分析及应用[J];中文信息学报;2008年01期

10 岑荣伟;刘奕群;张敏;茹立云;马少平;;基于日志挖掘的搜索引擎用户行为分析[J];中文信息学报;2010年03期

【共引文献】

中国期刊全文数据库 前10条

1 王建冬;王继民;;基于日志挖掘的高校用户期刊数据库检索行为研究[J];北京大学学报(自然科学版);2012年01期

2 李玉擰,肖创柏;蛋白质序列中可能存在的Zipf定律[J];北京工业大学学报;2005年04期

3 王洋;刘宇凡;陈清华;;汉语言文学作品中词频的Zipf分布[J];北京师范大学学报(自然科学版);2009年04期

4 杨国良;张捷;艾南山;刘波;;旅游流齐夫结构及空间差异化特征——以四川省为例[J];地理学报;2006年12期

5 赵媛;牛海玲;杨足膺;;我国石油资源流流量位序-规模分布特征变化[J];地理研究;2010年12期

6 韩筱璞;胡纯栋;;Power Law Distributions in the Experiment for Adjustment of the Ion Source of the NBI System[J];Plasma Science & Technology;2005年06期

7 谢意;张晖;;“韩寒代笔门”事件中的人类动力学分析[J];电脑知识与技术;2012年10期

8 吴晓刚;唐屹;;基于变异特征的文本信息检测算法[J];计算机安全;2006年11期

9 徐静;;图像搜索引擎的进步与应用现状分析[J];电子商务;2011年04期

10 彭波,李晓明;搜索引擎倒排文件的一种分块组织技术[J];电子学报;2005年02期

中国重要会议论文全文数据库 前7条

1 李国华;昝红英;;一种表征字符信息量的法则:Character's Law[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 方应谦;曹守见;王鲁;;基于语言知识的汉字识别新方法[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年

3 张全;张倪;韦向峰;;汉语语音识别的纠错处理[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

4 罗智勇;宋柔;;相似词及其在计算机辅助校对系统中的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

5 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年

6 王倩;刘奕群;马少平;茹立云;;面向用户互联网访问日志的异常点击分析[A];第五届全国信息检索学术会议论文集[C];2009年

7 杨震;殷俊;;移动互联网环境下适合运营商网络基础能力的搜索引擎设计研究[A];2012全国无线及移动通信学术大会论文集(下)[C];2012年

中国博士学位论文全文数据库 前10条

1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

2 曾迎生;地图图符提取与识别算法研究[D];国防科学技术大学;2003年

3 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年

4 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年

5 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年

6 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年

7 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

8 杨盛标;城市群产业圈层形成机制研究[D];湖南大学;2010年

9 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年

10 鲍媛媛;人类行为动力学的实证及生成机制研究[D];北京邮电大学;2012年

中国硕士学位论文全文数据库 前10条

1 吴世勇;基于聚类分析的搜索引擎自动性能评价研究[D];江西师范大学;2010年

2 朱培焱;汉英跨语言网址搜索引擎的设计与实现[D];西安电子科技大学;2010年

3 朱颖;基于HMM的汉语词性标注及其改进[D];太原理工大学;2011年

4 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年

5 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

6 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年

7 王立;基于习惯的人类动力学实证与建模研究[D];华中师范大学;2011年

8 蒋明原;云计算平台在搜索引擎中的关键技术研究[D];中北大学;2011年

9 何凤远;基于词频统计的齐夫定律汉语适用性研究[D];安徽大学;2011年

10 牛海玲;我国石油资源流动空间格局演化特征研究[D];南京师范大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期

2 陈建华;王国恩;;区域协调发展的政策途径[J];城市规划;2006年12期

3 许学强,叶嘉安;我国城市化的省际差异[J];地理学报;1986年01期

4 韩筱璞;周涛;汪秉宏;;基于自适应调节的人类动力学模型[J];复杂系统与复杂性科学;2007年04期

5 李楠楠;周涛;张宁;;人类动力学基本概念与实证分析[J];复杂系统与复杂性科学;2008年02期

6 李楠楠;张宁;周涛;;人类通信模式中基于时间统计的实证研究[J];复杂系统与复杂性科学;2008年03期

7 章忠志,荣莉莉;BA网络的一个等价演化模型[J];系统工程;2005年02期

8 石磊;高帆;;地区经济差距:一个基于经济结构转变的实证研究[J];管理世界;2006年05期

9 朱发仓;苏为华;;区域经济收敛与比较优势发展战略——基于行业的动态Panel模型分析[J];管理世界;2006年09期

10 张莹;万广华;;我国城市贫困地区差异之研究[J];管理世界;2006年10期

中国博士学位论文全文数据库 前4条

1 佘震宇;复杂经济系统演化建模研究[D];天津大学;2003年

2 迟妍;基于复杂适应系统理论的作战模型研究[D];国防科学技术大学;2004年

3 王文旭;复杂网络的演化动力学及网络上的动力学过程研究[D];中国科学技术大学;2007年

4 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年

中国硕士学位论文全文数据库 前1条

1 马宝军;短信网络拓扑结构及演化模型研究[D];北京邮电大学;2006年

【相似文献】

中国期刊全文数据库 前10条

1 牟华,周秀霞;网络信息计量学概论及应用探讨[J];情报资料工作;2002年06期

2 苏云,曹正民;网络信息计量学的研究和应用[J];西北师范大学学报(自然科学版);2004年02期

3 沈嵘;网络信息计量学的研究及其应用[J];现代情报;2004年06期

4 潘有能;网络信息计量学研究的力作——评《网络数据分析》[J];现代图书情报技术;2005年09期

5 张洋,邱均平;网络信息计量学的兴起及其哲学思考[J];情报杂志;2005年01期

6 邱均平,张洋;网络信息计量学综述[J];高校图书馆工作;2005年01期

7 苏新宁;网络信息计量学的新进展——评《网络数据分析》[J];图书情报知识;2005年02期

8 何爱琴;张芮;;网络信息计量学研究综述[J];科技情报开发与经济;2006年07期

9 沙勇忠;欧阳霞;;网络信息计量学研究方法的三维框架[J];中国图书馆学报;2006年02期

10 刘丹;;试论网络信息计量学的应用研究[J];现代情报;2006年11期

中国硕士学位论文全文数据库 前3条

1 欧阳霞;网络信息计量学方法论研究[D];兰州大学;2006年

2 金岩;网络信息计量学方法研究[D];中国科学院文献情报中心;2001年

3 朱自强;网络信息计量学理论与方法:大学网站网络流量及页面链接分析研究[D];南京理工大学;2005年



本文编号:970893

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/970893.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户60a3d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com