基于N层向量空间模型的信息检索算法
本文选题:搜索引擎 切入点:向量空间模型 出处:《计算机研究与发展》2002年10期
【摘要】:N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义了特征值向量和相似度的计算方法 ,使之能比较好地适应文档集合的动态扩充 .理论分析和实验结果表明 ,基于此模型实现的信息检索算法具有较快的查找速度和较高的查准率
[Abstract]:The N-layer vector space model is a new information retrieval algorithm model based on the traditional vector space model. This model logically divides a document into N relatively independent text segments. Then the text feature vector and the text weight vector are established according to the content of the text segment. On the basis of this model, the method of calculating the eigenvalue vector and the similarity degree is defined more accurately. The theoretical analysis and experimental results show that the information retrieval algorithm based on this model has faster searching speed and higher precision.
【作者单位】: 湖南大学计算机科学系 湖南大学计算机科学系 湖南大学计算机科学系
【基金】:湖南省自然科学基金资助 ( 0 1 JJY1 0 0 7)
【分类号】:TP391.1
【共引文献】
相关期刊论文 前10条
1 戴先宇,王明文,吴水秀,张石林;带参数的搜索引擎[J];江西师范大学学报(自然科学版);2002年04期
2 王颖楠,滕飞,解莉,孙俏;Web挖掘技术[J];吉林工学院学报(自然科学版);2002年01期
3 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
4 胥桂仙,许建潮,连远锋,李昱翠;文本挖掘中的特征表示及聚类方法[J];吉林工学院学报(自然科学版);2002年03期
5 许建潮,王颖楠,胥桂仙;Web文本信息抽取与挖掘方法[J];长春工业大学学报(自然科学版);2002年S1期
6 陈红英,李卫华;智能信息Agent的研究和实现[J];计算机工程与应用;2002年12期
7 刘斌;陈桦;;向量空间模型信息检索技术讨论[J];情报杂志;2006年07期
8 石冰,曹慧,卢军;一种HTML文档的朴素贝叶斯分类算法[J];山东大学学报(工学版);2003年03期
9 庄兵 ,曾子维 ,李国瑞;信息挖掘技术在信息搜索中的应用[J];微型机与应用;2003年09期
10 刘志为,何丕廉,孙越恒,郑小慎;N层向量空间模型在Web信息检索中的应用[J];微型机与应用;2004年12期
相关博士学位论文 前1条
1 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
相关硕士学位论文 前10条
1 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
2 钟敏娟;基于Web的文本信息检索算法研究[D];湖南大学;2004年
3 尤众喜;无边界学习及其支持和引导研究[D];华东师范大学;2005年
4 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
5 熊德兰;中文网页褒贬倾向性分类研究[D];郑州大学;2006年
6 刘瑜;一种用于站内搜索的层次链接分析算法[D];大连理工大学;2006年
7 张莹;基于自主学习的中文文本分类算法研究[D];哈尔滨工业大学;2006年
8 谢江标;最优搜索理论在元搜索引擎中的应用研究[D];电子科技大学;2007年
9 杜超华;基于本体的省情网垂直搜索引擎研究[D];华中师范大学;2007年
10 吴虎子;中文网页获取及自动分类技术研究[D];武汉理工大学;2007年
【相似文献】
相关期刊论文 前10条
1 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
2 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
3 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
4 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
5 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
6 李志明;李善平;杨朝晖;林欣;;基于本体分割的本体映射算法[J];模式识别与人工智能;2011年02期
7 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
8 李e,
本文编号:1663539
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1663539.html