一种结合超链接分析的搜索引擎排序方法
本文选题:搜索引擎 + 排序 ; 参考:《计算机工程》2004年15期
【摘要】:为了提高搜索引擎的检索性能,文章设计了一种搜索引擎的综合排序方法。它采用改进的布尔检索模式、中文分词、超链接分析以及索引链接文本等技术,主要具有以下特点:对经典布尔型检索模式所作的改进使得文档相关度不再是严格的0或1;超链接分析通过互联网的链接结构计算出每个网络文档的质量;通过中文分词和索引链接文本可以更加准确地获得一个网络文档的信息内涵。将3者结合可以充分利用各自优势而弥补不足。
[Abstract]:In order to improve the retrieval performance of search engine, a comprehensive sorting method of search engine is designed in this paper. It uses improved Boolean retrieval mode, Chinese word segmentation, hyperlink analysis and index link text technology. The main features are as follows: the improvement of the classical Boolean retrieval mode makes the document relevance is no longer strict 0 or 1; the hyperlink analysis calculates the quality of each network document through the link structure of the Internet; The information content of a network document can be obtained more accurately by Chinese word segmentation and indexed linked text. The combination of the three can make full use of their respective advantages to make up for deficiencies.
【作者单位】: 北京信息工程学院中文信息处理研究中心 北京信息工程学院中文信息处理研究中心
【分类号】:TP393.09
【共引文献】
相关期刊论文 前10条
1 朱广化;广义对角占优矩阵的一个定理[J];安徽教育学院学报;2003年06期
2 朱夜明;乔宗敏;;一道数学建模问题的Matlab求解方法[J];安庆师范学院学报(自然科学版);2006年01期
3 崔嵬;求最小外包容渐开螺旋面的算法模型[J];保定师范专科学校学报;2003年02期
4 崔嵬;非标准插值多项式的截断误差分析[J];保定师范专科学校学报;2004年02期
5 崔嵬;非标准插值基函数的构造[J];保定师范专科学校学报;2005年02期
6 吴永芝;万秋华;刘义生;;编码器光电信号参数的动态提取方法[J];半导体光电;2009年06期
7 王伟斌;路辉;郎荣玲;;基于数据拟合的雷达高度表告警信号测试方法[J];北京航空航天大学学报;2010年02期
8 王钟明,陈澍我,林国重;一种改进型刚性常微分方程数值解法——T-R预估-校正法[J];北京理工大学学报;1990年01期
9 张立新;刘娜;赵楠;;扩散硅压力变送器温度补偿研究[J];北京石油化工学院学报;2008年02期
10 刘学贞,刘卉,李世明;国际田联《男子十项全能评分表》修改初探[J];北京体育大学学报;2002年05期
相关会议论文 前2条
1 毋立芳;涂玲;申伟;;一种鲁棒的图像分割算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 张爱林;张翠翠;;弦支穹顶结构风速模拟研究[A];庆祝刘锡良教授八十华诞暨第八届全国现代结构工程学术研讨会论文集[C];2008年
相关博士学位论文 前10条
1 张熙;II-VI族半导体耦合/复合低维结构光学非线性[D];武汉大学;2009年
2 王永亮;微分求积法和微分求积单元法——原理与应用[D];南京航空航天大学;2001年
3 程海根;薄壁箱梁剪力滞效应理论分析与试验研究[D];西南交通大学;2003年
4 谢兵;连铸结晶器保护渣相关基础理论的研究及其应用实践[D];重庆大学;2004年
5 魏巍;考虑非弹性及二阶效应特征的钢筋混凝土框架柱的强度问题与稳定问题[D];重庆大学;2004年
6 赵亚平;钢筋混凝土梁损伤诊断的振动模态分析方法[D];中国农业大学;2005年
7 张于贤;超高压容器中的自增强理论的研究及应用[D];重庆大学;2005年
8 王刚;南海西北部陆架潮频内波生成过程的数值模拟[D];中国科学院研究生院(海洋研究所);2006年
9 吴先梅;瞬态单一声空化气泡的动力学过程及空化发光[D];中国科学院研究生院(声学研究所);2003年
10 唐万梅;几个预测方法及模型的研究[D];内蒙古大学;2006年
相关硕士学位论文 前10条
1 胡跃波;胶州湾溢油动态预报模式及可视化研究[D];中国海洋大学;2010年
2 陈洪科;基于现场数据的可靠性动态实时评估与预测系统的研究[D];哈尔滨理工大学;2010年
3 吴宪海;带有违约风险的可转债定价及实证分析[D];山东大学;2011年
4 褚曦丹;基于物理模型的烟雾模拟[D];安徽大学;2011年
5 吴国权;氯甲烷回收过程的建模与分析[D];浙江工业大学;2010年
6 衣鹏飞;船舶动力定位位置参考系统信息融合方法研究[D];哈尔滨工程大学;2011年
7 曹琦;超快电子衍射图像获取与解析系统[D];华东师范大学;2011年
8 杨正;考虑接触运动的机器人协调操作研究[D];北京工业大学;2000年
9 洪福昌;数控机床结合面特性参数的识别研究及其应用软件开发[D];北京工业大学;2000年
10 陶海;混凝土简支梁桥承载力评估[D];东北林业大学;2001年
【相似文献】
相关期刊论文 前10条
1 罗淑娴;;搜索引擎对网络信息资源评价的应用分析研究[J];图书馆学刊;2008年01期
2 郑利荣;;搜索引擎的主题提取算法研究[J];现代计算机(专业版);2008年07期
3 吕俊生,杨金凤;用于链接关系检索的搜索引擎的比较研究[J];情报杂志;2005年02期
4 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期
5 严丽丽;陈鹤年;季文天;雷景生;;基于超链接和相关度策略的克隆Web搜索方法[J];广西师范大学学报(自然科学版);2009年04期
6 杨木容;;搜索引擎在网络链接分析中的应用研究[J];图书情报工作;2006年11期
7 陈爽;钱榕;陈福;李素;;网页链接繁殖在搜索引擎资源发现中的应用[J];计算机工程与应用;2007年36期
8 汤天波;高峰;;可视化技术在网络链接分析中的应用研究[J];现代图书情报技术;2009年02期
9 张祥;葛唯益;瞿裕忠;;语义网站点的发现与排序[J];软件学报;2009年10期
10 吴明礼,施水才;一种结合超链接分析的搜索引擎排序方法[J];计算机工程;2004年15期
相关会议论文 前10条
1 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
相关重要报纸文章 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 朱伟;雅虎中国“变脸”搜索引擎[N];文汇报;2005年
7 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
8 商报记者 吴辰光;搜索引擎市场趋向细分化[N];北京现代商报;2006年
9 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
10 元元;从单向搜索转向多维和垂直搜索[N];证券日报;2006年
相关博士学位论文 前10条
1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
2 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
3 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
4 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年
5 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
6 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
7 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
8 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
9 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
10 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
相关硕士学位论文 前10条
1 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
2 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
3 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
4 刘青伟;搜索引擎中的Pagerank排序算法研究分析[D];电子科技大学;2010年
5 崔顷顷;基于个性化搜索的系统研究与设计[D];北京交通大学;2011年
6 任妤;基于Nutch的科技主题搜索引擎Crawler的研究与实现[D];内蒙古科技大学;2011年
7 温泉;基于聚焦相关度排序的搜索引擎研究与应用[D];东华大学;2010年
8 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
9 苏国荣;校园网搜索引擎排序的去重方法研究[D];国防科学技术大学;2010年
10 龚勇;搜索引擎中网络爬虫的研究[D];武汉理工大学;2010年
本文编号:2039501
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2039501.html