当前位置:主页 > 管理论文 > 移动网络论文 >

结合PCM聚类算法的网页排序

发布时间:2019-04-08 14:59
【摘要】:针对传统的网页排序算法中容易出现的忽略搜索结果主题相关性和主题漂移的问题,提出了结合PCM聚类算法的网页排序,用来提高搜索结果中网页主题的相关性并减少其主题漂移。首先,通过查询某个主题,运用随机行走(RWM)的方法来计算两个网页之间的对称社会距离(SSD);然后,用SSD和PCM聚类算法对网页进行聚类,得到相关主题的各个社区,通过计算得到各个社区中成员属于该社区的概率表示;最后,根据各社区成员的概率和网页的推荐度对网页进行排序。实验结果表明,与PageRank算法相比,该算法搜索结果中网页主题的相关程度更高;另外,由于是针对某个主题的排序,该算法减少了主题漂移。
[Abstract]:Aiming at the problem of ignoring the relevance and the topic drift of the search results which are easy to appear in the traditional webpage sorting algorithm, the webpage ordering combined with the PCM clustering algorithm is proposed, which is used for improving the relevance of the webpage topics in the search results and reducing the subject drift. First, the symmetric social distance (SSD) between the two web pages is calculated by querying a subject, using a random walk (RWM) method, then clustering the webpage with the SSD and the PCM clustering algorithm to obtain various communities of the related topic, And finally, the webpage is sorted according to the probability of each community member and the recommendation degree of the webpage. The experimental results show that, compared with the PageRank algorithm, the relative degree of the webpage theme in the algorithm search results is higher; in addition, the algorithm reduces the topic drift due to the ordering of a certain topic.
【作者单位】: 江西理工大学信息工程学院;
【基金】:江西省教育厅科技资助项目(GJJ11463)
【分类号】:TP393.092

【参考文献】

相关期刊论文 前2条

1 罗武;方逵;朱兴辉;;网络搜索引擎排序算法研究进展[J];湖南农业科学;2010年07期

2 田甜;倪林;钱功伟;;一种结合社区发现的网页排序算法[J];计算机工程与应用;2007年12期

【共引文献】

相关期刊论文 前2条

1 梁永演;;浅析搜索引擎的超链接分析排序算法[J];晋图学刊;2011年04期

2 梁永演;;浅析搜索引擎的超链接分析排序算法[J];图书情报论坛;2011年Z2期

相关硕士学位论文 前5条

1 轩春青;基于客户反馈的FTP搜索引擎的研究与设计[D];郑州大学;2011年

2 卢志翔;全文检索系统研究[D];广西大学;2011年

3 黎冬;基于Linux平台FTP搜索引擎的研究[D];湖北工业大学;2009年

4 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年

5 董书玲;搜索引擎排序算法的研究与改进[D];辽宁工程技术大学;2012年

【二级参考文献】

相关期刊论文 前5条

1 袁占亭,张秋余,董建设;智能信息搜索系统中对搜索结果的排序策略[J];计算机工程与应用;2004年02期

2 张映海;何中市;陈永锋;;搜索引擎结果中Web文档的排序研究[J];计算机与数字工程;2007年02期

3 李绍华;高文宇;;搜索引擎页面排序算法研究综述[J];计算机应用研究;2007年06期

4 王林,戴冠中;复杂网络中的社区发现——理论与应用[J];科技导报;2005年08期

5 陈朝伟;;搜索引擎的排序技术及其在计算机网络上的应用[J];科技经济市场;2006年06期

【相似文献】

相关期刊论文 前10条

1 谢鲲;张大方;谢高岗;文吉刚;黎文伟;;一种基于网络业务流的流量监测分析算法[J];小型微型计算机系统;2006年01期

2 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期

3 田甜;倪林;钱功伟;;一种结合社区发现的网页排序算法[J];计算机工程与应用;2007年12期

4 张祥;葛唯益;瞿裕忠;;语义网站点的发现与排序[J];软件学报;2009年10期

5 单爱民;一种统一开放的互联网信息搜索排序公式的研究[J];现代计算机;2005年03期

6 郑建华,赵政;Web页面排序算法研究[J];微计算机应用;2003年05期

7 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期

8 吴刚;张阔;李涓子;王克宏;;利用相互增强关系迭代计算本体中概念与关系的重要性[J];计算机学报;2007年09期

9 王冬;雷景生;李壮;;基于PageRank的页面排序改进算法[J];计算机工程与设计;2008年22期

10 王冬;雷景生;;一种基于PageRank的页面排序改进算法[J];微电子学与计算机;2009年04期

相关会议论文 前7条

1 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年

2 刘凯鹏;方滨兴;;一种基于社会性标注的网页排序算法[A];第五届全国信息检索学术会议论文集[C];2009年

3 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

4 陈欣;高建华;;测试用例集的双优排序研究[A];第六届中国测试学术会议论文集[C];2010年

5 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

7 秦龙;蔡沛霖;;计算机终端物理隔离技术[A];经济策论(下)[C];2011年

相关博士学位论文 前3条

1 刘玉婷;网页排序中的随机模型及算法[D];北京交通大学;2009年

2 韩晓晖;Web社会媒体中信息的质量评价及应用研究[D];山东大学;2012年

3 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

相关硕士学位论文 前10条

1 彭聪;一种在移动网络环境下的网页排序算法的研究[D];湖南大学;2010年

2 陈辉;金融领域的博客信息采集与排序算法研究[D];哈尔滨工业大学;2009年

3 杨成;Web结构挖掘中的页面排序算法研究[D];西安电子科技大学;2011年

4 张士军;基于随机游走的网页协同排序算法研究[D];大连理工大学;2010年

5 董智才;关于IP数据流排序,,归并和长时段分析模块的设计与实现[D];北京大学;2007年

6 郑州斌;基于内容与链接分析的主题相关网站排序算法的研究[D];浙江大学;2008年

7 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年

8 秦辉;基于重要性传递模型的Web页面静态排序算法[D];大连理工大学;2007年

9 张砚明;基于链接结构分析的Web页面排序算法[D];西安电子科技大学;2010年

10 王昭华;基于链接分析的Blog网页排序算法的研究[D];东北大学;2009年



本文编号:2454678

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2454678.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户768a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com