当前位置:主页 > 教育论文 > 基础教育论文 >

基于转移概率的PageRank算法研究

发布时间:2016-12-05 12:00

  本文关键词:基础教育资源搜索引擎的排序算法研究,由笔耕文化传播整理发布。


《暨南大学》 2009年

基于转移概率的PageRank算法研究

张永强  

【摘要】: PageRank算法是Google搜索引擎开发的用于评价网页重要性的一种网页级别排序算法。它用有向图描述网页及其超链接,把用户浏览行为看成为一个Markov随机冲浪模型,并定义极限状态下各网页被访问的概率分布为PageRank值,此PageRank值给出了网页重要性的排序。本文首先介绍了经典的PageRank算法,然后对另一种基于转移概率矩阵的PageRank算法进行了介绍、分析和改进。最后基于对前面两种PageRank算法的比较分析,提出了一种新的基于转移概率矩阵的网页级别算法,即根据网页的原PageRank值与自身出链的数目的比值在链入到该网页的所有网页的PageRank值与自身出链的数目的比值总和所占比例定义转移概率。实验分析表明,以此模型得出的网页排序更具合理性。

【关键词】:
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:O211.62
【目录】:

  • 中文摘要4-5
  • ABSTRACT5-6
  • 目录6-8
  • 8-9
  • 第一章 经典PageRank算法9-15
  • 1.1 PageRank算法简介9-11
  • 1.2 Markov链的简单介绍11-13
  • 1.3 PageRank矩阵排序算法13-15
  • 第二章 另一种转移概率矩阵算法15-20
  • 2.1 转移概率矩阵算法的简介15-17
  • 2.2 对该算法计算方法上的改进17-20
  • 2.3 实验分析20
  • 第三章 一种新的概率转移矩阵算法20-26
  • 3.1 新的PageRank算法20-21
  • 3.2 实验设计21-26
  • 3.2.1 第一种试验计算方法22-24
  • 3.2.2 第二种试验方法24-26
  • 3.3 实验分析26
  • 3.4 本章小结26
  • 第四章 总结和展望26-28
  • 主要参考文献28-29
  • 致谢29
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【引证文献】

    中国硕士学位论文全文数据库 前1条

    1 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年

    【参考文献】

    中国期刊全文数据库 前3条

    1 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期

    2 李吉平;吴陈;曾庆军;;基于转移概率的PageRank算法研究[J];科学技术与工程;2008年08期

    3 曹军;Google的PageRank技术剖析[J];情报杂志;2002年10期

    中国硕士学位论文全文数据库 前1条

    1 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年

    【共引文献】

    中国期刊全文数据库 前10条

    1 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期

    2 徐金雷;杨晓江;;基础教育资源搜索引擎的排序算法研究[J];电化教育研究;2007年02期

    3 钟斌青;刘湘南;;基于空间化PageRank算法的人口流动空间集聚性分析[J];地理与地理信息科学;2011年05期

    4 王玉珍;;Google的PageRank技术分析[J];电脑学习;2007年05期

    5 付涛;;基于背景的Web广泛主题发现方法[J];电脑学习;2010年02期

    6 肖铮;庄建;庄重;;基于链接结构的PageRank排序算法研究[J];电脑知识与技术;2009年20期

    7 唐培和,杨新伦,刘浩;Google搜索引擎及其实现技术[J];广西工学院学报;2004年02期

    8 王钢生;;中等职业学校校园网络建设思路和实践方案探讨[J];电脑与电信;2007年05期

    9 侯青;;超链接的方式给应用程序传递参数方法的实现[J];信息技术;2009年10期

    10 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期

    中国重要会议论文全文数据库 前1条

    1 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

    中国博士学位论文全文数据库 前4条

    1 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年

    2 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年

    3 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年

    4 张格伟;基于工艺知识网格的可重构CAPP系统关键技术研究[D];南京航空航天大学;2008年

    中国硕士学位论文全文数据库 前10条

    1 翁岩青;网页抓取策略研究[D];哈尔滨工程大学;2010年

    2 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年

    3 于飞;基于搜索引擎的个性化推荐研究[D];哈尔滨理工大学;2010年

    4 陈可钦;基于垂直搜索引擎的主题爬虫算法的研究[D];中南林业科技大学;2009年

    5 陈潇;油脂企业故障信息管理与诊断系统设计与实现[D];西安电子科技大学;2009年

    6 陈志刚;网络Flash资源爬行器的设计与实现[D];山东师范大学;2011年

    7 姜博;基于聚焦爬虫的web信息采集技术研究[D];北方工业大学;2011年

    8 曹仲伟;FTP搜索引擎的关键技术研究[D];湖北工业大学;2011年

    9 周源;基于本体的语义垂直搜索引擎研究[D];北京交通大学;2011年

    10 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年

    【同被引文献】

    中国期刊全文数据库 前1条

    1 孙宇;贾凌云;任军;;蛋白质相互作用的研究方法[J];分析化学;2007年05期

    中国硕士学位论文全文数据库 前1条

    1 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年

    【二级参考文献】

    中国期刊全文数据库 前3条

    1 许南山;丛磊;;Pagerank二维线性收敛方法[J];计算机应用;2006年06期

    2 张丽;;PageRank算法的改进[J];科学技术与工程;2007年05期

    3 夏莉,黄正洪;马尔可夫链在人力资源预测中的应用[J];统计与决策;2005年03期

    【相似文献】

    中国期刊全文数据库 前10条

    1 柳泉波;许骏;;基于链接分析的科学文献个性化排序算法[J];中山大学学报(自然科学版);2008年06期

    2 王向阳;马军;;一个基于PageRank的科技文献质量评价算法[J];广西师范大学学报(自然科学版);2009年01期

    3 杨海东,张莉;PageRank技术分析与搜索引擎检索效率研究[J];淮阴师范学院学报(自然科学版);2003年03期

    4 石晶,龚震宇,裘杭萍,张毓森;一种更稳定的链接分析算法——子空间HITS算法[J];吉林大学学报(理学版);2003年01期

    5 黎斌;鲜明;;web超链分析技术[J];科技信息(学术研究);2008年09期

    6 石小康;;网络计量学的研究现状与发展[J];黑龙江科技信息;2009年25期

    7 陈丽萍;;谈基于链接分析的web社区发现技术[J];科技信息;2009年31期

    8 张佳;梁少华;;Web结构挖掘与其基于超链接结构的算法[J];科技信息;2007年02期

    9 潘大胜;;面向校园网搜索引擎的PageRank改进算法[J];湖南文理学院学报(自然科学版);2009年01期

    10 张光年;李茂青;;基于PageRank算法的一种搜索引擎优化方法及实现[J];科技信息;2007年04期

    中国重要会议论文全文数据库 前10条

    1 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年

    2 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年

    3 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

    4 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

    5 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

    6 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

    7 宋丹;林鸿飞;杨志豪;;一种利用链接分析的Web话题跟踪方法[A];第三届学生计算语言学研讨会论文集[C];2006年

    8 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

    9 邹纲;孟遥;于浩;西野文人;;一种基于网站主页信息建立公司名称知识库的方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

    10 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

    中国重要报纸全文数据库 前10条

    1 本报记者 马文方;[N];中国计算机报;2008年

    2 喻宁;[N];经理日报;2004年

    3 中国科学院计算技术研究所 王 斌;[N];计算机世界;2004年

    4 文/大海;[N];计算机世界;2004年

    5 本报记者 侯继勇 刘涓涓 郑小伶 亦有;[N];21世纪经济报道;2005年

    6 希安;[N];经济日报;2004年

    7 复旦大学国际政治系博士 沈逸;[N];东方早报;2010年

    8 钱鹏;[N];电脑报;2004年

    9 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;[N];计算机世界;2003年

    10 本报记者 王翌;[N];计算机世界;2004年

    中国博士学位论文全文数据库 前10条

    1 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年

    2 褚武英;三种石首鱼紧密连锁的α-和β-珠蛋白基因的克隆及其顺式调控元件的分析[D];浙江大学;2006年

    3 王菁华;文本中知识的获取[D];北京邮电大学;2008年

    4 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年

    5 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年

    6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年

    7 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年

    8 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年

    9 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年

    10 徐秀娟;商务智能中的利润挖掘研究[D];吉林大学;2008年

    中国硕士学位论文全文数据库 前10条

    1 张永强;基于转移概率的PageRank算法研究[D];暨南大学;2009年

    2 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年

    3 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年

    4 袁方;基于改进PageRank算法的个性化搜索的研究[D];北京邮电大学;2012年

    5 县小平;搜索引擎PageRank算法研究[D];西北大学;2010年

    6 高宝军;Web结构挖掘中PageRank算法优化研究[D];兰州大学;2011年

    7 郭坤银;基于页面分块和链接分析的Web图片检索研究[D];重庆大学;2009年

    8 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年

    9 陈翰生;基于改进HITS算法及位置信息的关键网页信息抽取方法[D];复旦大学;2009年

    10 杨鑫;基于链接分析的电信呼叫数据研究与应用[D];北京邮电大学;2009年


      本文关键词:基础教育资源搜索引擎的排序算法研究,由笔耕文化传播整理发布。



    本文编号:205198

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/jichujiaoyulunwen/205198.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户5bf06***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com