当前位置:主页 > 科技论文 > 搜索引擎论文 >

Web信息检索结构化排序函数与标引词加权技术

发布时间:2019-05-27 13:55
【摘要】:分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息检索排序函数和标引词加权技术。分析了Web文档的特点,指出其主要形式HTML文档是一种结构化文档,结构由标签显式地定义,不同文档结构对检索性能的贡献不同。对本领域国内外学者的成果作了对比研究。最后探讨了Web信息检索排序函数及标引词加权技术的发展方向。
[Abstract]:This paper analyzes on the present situation of Web information retrieval technology, and points out that the fundamental reason for the low retrieval efficiency lies in the sorting function and index word weighting technology used by the search engine. This paper introduces the traditional information retrieval sorting function and index word weighting technology. This paper analyzes the characteristics of Web documents, and points out that the main form of HTML documents is a structured document, the structure of which is explicitly defined by tags, and the contributions of different document structures to retrieval performance are different. The achievements of scholars at home and abroad in this field are compared and studied. Finally, the development direction of Web information retrieval sorting function and index word weighting technology is discussed.
【作者单位】: 海南大学信息科学技术学院通信与信息系统重点实验室 海南大学信息科学技术学院通信与信息系统重点实验室
【基金】:国家教育部科学技术重点研究项目(the Key Technologies Project of the Ministry of Education of China No.03144) 海南省自然科学基金(the Natural Science Foundation of Hainan Province of China under Grant No.60533)。
【分类号】:TP391.3

【参考文献】

相关期刊论文 前1条

1 韩毅;基于文档结构的向量空间检索模型研究[J];情报学报;2004年02期

【共引文献】

相关期刊论文 前10条

1 戴先宇,王明文,吴水秀,张石林;带参数的搜索引擎[J];江西师范大学学报(自然科学版);2002年04期

2 陈治平,林亚平,童调生;基于N层向量空间模型的信息检索算法[J];计算机研究与发展;2002年10期

3 王颖楠,滕飞,解莉,孙俏;Web挖掘技术[J];吉林工学院学报(自然科学版);2002年01期

4 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期

5 胥桂仙,许建潮,连远锋,李昱翠;文本挖掘中的特征表示及聚类方法[J];吉林工学院学报(自然科学版);2002年03期

6 许建潮,王颖楠,胥桂仙;Web文本信息抽取与挖掘方法[J];长春工业大学学报(自然科学版);2002年S1期

7 陈红英,李卫华;智能信息Agent的研究和实现[J];计算机工程与应用;2002年12期

8 张孝飞;黄河燕;陈肇雄;代六玲;;跨语言信息检索中查询语句翻译转换算法[J];计算机工程;2007年11期

9 夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期

10 刘斌;陈桦;;向量空间模型信息检索技术讨论[J];情报杂志;2006年07期

相关会议论文 前1条

1 张孝飞;代六玲;黄河燕;陈肇雄;;跨语言信息检索中查询关键词翻译转换算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年

相关博士学位论文 前2条

1 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年

2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

相关硕士学位论文 前10条

1 崔得暄;Web文本自动分类技术研究[D];华中科技大学;2006年

2 宋玲玲;网络搜索引擎中检索器检索方法研究[D];中国石油大学;2007年

3 谢江标;最优搜索理论在元搜索引擎中的应用研究[D];电子科技大学;2007年

4 钱升华;基于支持向量机的手机垃圾短信过滤器的研究[D];河北工业大学;2006年

5 王庆涛;基于本体的Web信息采集研究[D];中南大学;2007年

6 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年

7 李少辉;基于WEB的协同设计中的信息管理研究[D];山东师范大学;2006年

8 熊德兰;中文网页褒贬倾向性分类研究[D];郑州大学;2006年

9 刘瑜;一种用于站内搜索的层次链接分析算法[D];大连理工大学;2006年

10 张莹;基于自主学习的中文文本分类算法研究[D];哈尔滨工业大学;2006年

【二级参考文献】

相关期刊论文 前1条

1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期

【相似文献】

相关期刊论文 前10条

1 陶志成;编译组合理论[J];计算机学报;1980年01期

2 邓自立 ,周永声;RS算法及其在管理工程中的应用[J];华南理工大学学报(自然科学版);1984年03期

3 张亚南;一种实用的数值型伪Hash函数排序方法[J];计算机研究与发展;1993年10期

4 王永吉,,邹德 ;Borland C~(++)2.0排序函数QSORT()的用法[J];计算机时代;1995年06期

5 王国安,王刚;用内码转换法解决按姓氏笔划排序问题[J];现代电子技术;1998年07期

6 刘军,王士俊;串联系统精确置信下限计算和奇点消除[J];系统工程与电子技术;1999年04期

7 袁一林,李晓平;Delphi中多线程应用程序的编制[J];电子与电脑;1999年02期

8 ;擂台赛1999年第16期点评[J];电脑爱好者;1999年22期

9 于海斌,薛劲松,王浩波,徐心和;基于遗传算法的单机提前/拖期调度方法研究[J];控制理论与应用;2000年02期

10 董杨琴;浅谈C语言中的复杂指针[J];南通职业大学学报;2000年03期



本文编号:2486203

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2486203.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户88fa3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com