当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于改进排序算法的用户查询优化的研究

发布时间:2018-07-28 06:36
【摘要】:互联网的迅速发展使信息检索的环境发生了重大变化。而基于互联网的搜索引擎的排序算法直接关系到用户在新的环境里进行信息检索的使用体验。文中提出一种将PageRank算法、分类技术、文档TF-IDF(词频-逆向词频)值相结合的方法,对排序算法进行改进。该算法对于用户查询的关键字进行预分类,判断用户的输入关键字最可能属于的文本类型。基于此优先从Solr库中取出类别相似的数据,使得主题相关的文本靠前显示。实验结果表明,该排序算法具有较快的查询响应时间和较高的查准率。
[Abstract]:With the rapid development of Internet, the environment of information retrieval has changed greatly. The sorting algorithm of Internet based search engine is directly related to the user's experience of information retrieval in the new environment. In this paper, a method of combining PageRank algorithm, classification technology and document TF-IDF (word frequency reverse word frequency) value is proposed to improve the sorting algorithm. The algorithm pre-classifies the keywords queried by the user and determines the most likely text type to which the user's input keywords belong. Based on this priority, similar data is extracted from the Solr library so that the topic related text is displayed forward. Experimental results show that the algorithm has faster query response time and higher precision.
【作者单位】: 南京邮电大学计算机学院;江苏省无线传感网高技术研究重点实验室;
【基金】:国家自然科学基金资助项目(61373139) 江苏省自然科学基金(BK2012833) 江苏省高校自然科学基金(12KJB520011) 南京邮电大学科研基金(NY213160)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前9条

1 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期

2 王福海;;基于PageRank的主题过滤算法改进[J];科技信息;2011年15期

3 陈建峡;黄日;马忠宝;;基于PageRank的Lucene排序算法优化与实现[J];计算机工程与科学;2012年10期

4 詹志建;杨小平;;基于语言网络和语义信息的文本相似度计算[J];计算机工程与应用;2014年05期

5 刘英伟;秦永彬;;基于余弦相似性的m-类分类器设计与算法实现[J];计算机与数字工程;2014年03期

6 舒忠梅;左亚尧;张祖传;;时态信息的语义抽取与排序方法研究及系统实现[J];计算机工程与科学;2014年08期

7 原福永;张园园;;基于链接分析的相关排序方法的研究和改进[J];计算机工程与设计;2007年07期

8 林泓;刘朋;李晶晶;龙振海;;基于概率的PageRank改进算法[J];武汉理工大学学报;2009年03期

9 吴德;刘三阳;;支持向量域多分类器[J];西安交通大学学报;2012年06期

【共引文献】

相关期刊论文 前10条

1 杨生举;蒙杰;赵昕辉;杜雨璐;;基于文本挖掘的科研项目网上评审系统研究与实现[J];甘肃科技;2012年15期

2 刘喜文;郑昌兴;王文龙;汤刚强;;构建数据仓库过程中的数据清洗研究[J];图书与情报;2013年05期

3 徐国浪;魏延;;基于二叉树结构双优化的SVM多分类算法研究[J];重庆师范大学学报(自然科学版);2013年06期

4 潘善亮;茅琴娇;韩露;;一种基于虚拟社交化的Web服务发现方法研究[J];电信科学;2013年12期

5 宋艳;何嘉;舒红平;郑皎凌;梁繁荣;任玉兰;文立玉;;基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究[J];成都信息工程学院学报;2014年01期

6 顾益军;解易;张培晶;;面向有组织犯罪分析的人际关系网络节点重要性评价研究[J];中国人民公安大学学报(自然科学版);2013年04期

7 郑晶;;基于云计算的Pagerank算法的改进[J];福州大学学报(自然科学版);2014年01期

8 "基于大数据的互联网化存量经营"项目组;"基于用户感知的运维转型"项目组;;运营商存量经营大数据平台及其关键技术研究[J];电信科学;2014年06期

9 张喜平;李永树;刘刚;王蕾;;节点重要度贡献的复杂网络节点重要度评估方法[J];复杂系统与复杂性科学;2014年03期

10 龚卫华;郭伟鹏;杨良怀;;信任网络中多维信任序列模式挖掘方法研究[J];电子与信息学报;2014年08期

相关会议论文 前3条

1 Xu Guo Lang;Wei Yan;;Binary tree classification algorithm based on GA and Its Application in the gear Machine Fault Diagnosis[A];第25届中国控制与决策会议论文集[C];2013年

2 段靖芳;;一种基于信息过滤的个性化学习环境模型[A];计算机与教育:应用促进学与教创新——全国计算机辅助教育学会第十三届学术年会论文集[C];2008年

3 刘建国;;教学资源库系统的个性化推荐服务设计与实现[A];计算机与教育:应用促进学与教创新——全国计算机辅助教育学会第十三届学术年会论文集[C];2008年

相关博士学位论文 前10条

1 申文武;无结构P2P网络中基于语义和节点存储能力的搜索关键技术研究[D];北京邮电大学;2011年

2 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年

3 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年

4 马飞;云数据中心中虚拟机放置和实时迁移研究[D];北京交通大学;2013年

5 乐承毅;企业知识与员工知识贡献度集成评价方法及应用研究[D];浙江大学;2013年

6 孙甲申;基于主题模型和随机游走的标签技术研究[D];北京邮电大学;2013年

7 张鹏;数据中心网络的流量管理和优化问题研究[D];北京邮电大学;2013年

8 马琳;面向移动互联网的开放服务技术架构及若干关键技术研究[D];北京邮电大学;2013年

9 龚书;抽取式多文档文摘的文本表示研究[D];北京交通大学;2013年

10 尹莉;基础数学领域作者合作网络实证分析[D];西北大学;2013年

相关硕士学位论文 前10条

1 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年

2 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年

3 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年

4 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年

5 贾增朝;用于图像检索的视觉词汇树研究[D];西北大学;2011年

6 张韦;基于语义的Web主题提取的研究[D];湖北工业大学;2011年

7 丁若尧;基于博客的网络话题发现及追踪的研究[D];北京交通大学;2011年

8 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年

9 邱伟林;面向领域的垂直搜索引擎的研究与实现[D];大连海事大学;2011年

10 黎源;基于粗糙集的中文文本分类在邮件过滤中的研究[D];暨南大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 孙铁利,杨凤芹;根据用户隐式反馈建立和更新用户兴趣模型[J];东北师大学报(自然科学版);2003年03期

2 谢翠香;;基于改进向量空间模型的学术论文相似性辨别系统设计[J];电脑知识与技术;2009年19期

3 潘志松;陈斌;缪志敏;倪桂强;;One-Class分类器研究[J];电子学报;2009年11期

4 景丽萍,黄厚宽,石洪波;用于文本挖掘的特征选择方法TFIDF及其改进[J];广西师范大学学报(自然科学版);2003年01期

5 徐德志;申红婷;;网页排名算法及其应用[J];贵州大学学报(自然科学版);2007年05期

6 余小兵;;Google搜索引擎的核心——PageRank算法综述[J];电脑与电信;2006年12期

7 施侃晟;刘海涛;白英彩;宋文涛;洪亮亮;;余弦度量和适应度函数改进的聚类方法[J];电子科技大学学报;2013年04期

8 吴伟;陈建峡;;基于Heritrix的web信息抽取优化与实现[J];湖北工业大学学报;2012年02期

9 初建崇;刘培玉;王卫玲;;Web文档中词语权重计算方法的改进[J];计算机工程与应用;2007年19期

10 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[J];计算机工程与应用;2007年35期

相关硕士学位论文 前4条

1 史鹏辉;专业服务网站搜索引擎的设计与实现[D];大连理工大学;2004年

2 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年

3 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年

4 王宇;基于TFIDF的文本分类算法研究[D];郑州大学;2006年

【相似文献】

相关期刊论文 前10条

1 朱建莉,刘宏强;常用排序算法综述[J];胜利油田师范专科学校学报;2002年04期

2 周海岩,郝保树;一种新的桶分配链接排序算法[J];太原师范专科学校学报;2002年01期

3 赵忠孝;基于概率分布的排序算法(1)[J];计算机工程与应用;2002年11期

4 赵忠孝;基于概率分布的排序算法(2)[J];计算机工程与应用;2002年12期

5 何文明;针对任意分布数据的高效分档混合排序算法[J];计算机工程与应用;2003年22期

6 尤志强,张大方;数据等概率分档排序算法有效性的定量研究[J];计算机学报;2003年01期

7 穆炯,蒲海波;对按位分段排序算法的研究[J];四川农业大学学报;2004年01期

8 李井润;一种基于统计的分段排序算法[J];微计算机应用;2004年03期

9 曹清录,王念平,张斌;合并排序算法的平均情形复杂性分析及其应用[J];计算机工程;2004年21期

10 余炳惠,王克刚;排序算法的选择及一些改进[J];安康师专学报;2004年04期

相关会议论文 前10条

1 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年

2 张艳秋;李建中;;一种基于蛇型磁带的排序算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

3 刘春阳;叶君峰;母海龙;陆秋霞;陈沧;高莺;;一种商品标题主题词的重要性排序算法[A];第五届全国信息检索学术会议论文集[C];2009年

4 王少帅;汤庆新;姚路;;并行独立集排序算法的改进与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年

5 于芳;王大玲;于戈;陈冬玲;鲍玉斌;;面向用户的排序算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

6 闫泼;马军;陈竹敏;;面向主题的网页排序算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 吴志彬;陈义华;;ANP中超矩阵排序算法研究[A];2006中国控制与决策学术年会论文集[C];2006年

9 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年

10 齐曼;张珩;;实时视觉仿真中帧连贯性应用[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年

相关重要报纸文章 前1条

1 广东 黄陀;基本算法简介(三)[N];电脑报;2001年

相关博士学位论文 前3条

1 赵立军;基于归并的高效排序算法的研究[D];中国科学院研究生院(计算技术研究所);1998年

2 崔筠;无向基因组的移位排序算法[D];山东大学;2006年

3 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年

相关硕士学位论文 前10条

1 王靖;数据库管理系统中高能效排序算法[D];浙江工业大学;2012年

2 尹晓;基因组移位排序算法的改进和评测[D];山东大学;2006年

3 黄兴;比特位拆分索引排序算法研究[D];清华大学;2007年

4 Mushtaq AbdulMutalib Hasson;一种论文时间与引用兼顾的科研论文排序算法[D];华中科技大学;2012年

5 刘声田;基于第一降序小队翻转排序算法的设计与实现[D];山东大学;2006年

6 曹臻;基于粗糙集的粒度排序算法[D];上海海事大学;2007年

7 侯红梅;图像搜索重排序算法研究[D];山东大学;2014年

8 徐艳霞;面向数学搜索的排序算法研究[D];兰州大学;2012年

9 张建英;稀疏正则化最小二乘排序算法[D];湖北大学;2011年

10 廉洁;改进的内容分析排序算法在搜索引擎中的研究与应用[D];大连交通大学;2013年



本文编号:2149233

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2149233.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f05de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com