当前位置:主页 > 科技论文 > 搜索引擎论文 >

结构化向量空间模型及其在Web信息检索中的应用

发布时间:2018-04-19 04:15

  本文选题:向量空间模型 + 信息检索 ; 参考:《北京工业大学学报》2008年04期


【摘要】:针对Web信息检索的特点,通过分析传统向量空间模型在Web检索中存在的若干问题,对传统向量空间模型进行改进,并提出结构化向量空间模型,其基本思想是将Web文档表达为具有一定逻辑结构的向量,即结构化向量组.每个结构化向量组由若干子向量构成,每个子向量对应Web文档中相对应独立的文本段.理论分析和实验证明,该方法能提高向量空间模型在信息检索精度和召回率方面的性能.
[Abstract]:According to the characteristics of Web information retrieval, by analyzing some problems existing in the traditional vector space model in Web retrieval, the traditional vector space model is improved, and the structured vector space model is proposed.The basic idea is to express the Web document as a vector with certain logical structure, that is, structured vector group.Each structured vector group consists of several subvectors, each corresponding to an independent text segment in an Web document.Theoretical analysis and experiments show that this method can improve the performance of vector space model in information retrieval accuracy and recall rate.
【作者单位】: 北京工业大学计算机学院 北京工业大学计算机学院 北京工业大学计算机学院
【基金】:国家自然科学基金(60775010) 北京市属市管高等学校“中青年骨干教师培养计划”资助项目(05007011200607)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前4条

1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期

2 邹涛;王继成;杨文清;张福炎;;文本信息检索技术[J];计算机科学;1999年09期

3 吕铁强,于满泉,孟庆发,周立德;基于网页分块的个性化信息采集的研究与设计[J];微电子学与计算机;2005年10期

4 陶跃华;基于向量的相似度计算方案[J];云南师范大学学报(自然科学版);2001年05期

【共引文献】

相关期刊论文 前10条

1 胡凌云;胡桂兰;徐勇;李龙澍;;基于Web的新闻文本分类技术的研究[J];安徽大学学报(自然科学版);2010年06期

2 郑康锋;郭世泽;杨义先;王秀娟;;基于树与网结合的可控蠕虫网络结构模型[J];兵工学报;2008年10期

3 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期

4 敖成龙,苏英,龚元明;基于相似度的复杂数据对象比较[J];北京理工大学学报;2003年05期

5 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期

6 焦黎冰;封化民;何文才;李雪龙;;一种改进的基于Web的新闻视频内容语义分析方法[J];江西师范大学学报(自然科学版);2008年02期

7 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期

8 王纪辉;赵卓宁;;基于协同过滤算法的电子商务网站个性化推荐系统设计[J];成都信息工程学院学报;2007年S1期

9 彭喜化;黄睿;;基于向量空间模型的多关键字检索技术[J];重庆职业技术学院学报;2006年03期

10 赵洋;滕桂法;张玉新;何冬梅;;基于Internet的农业信息垂直搜索引擎的设计[J];河北农业大学学报;2009年06期

相关会议论文 前10条

1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年

2 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年

3 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年

4 姜丽华;张宏斌;;基于Multi-Agent的个性化Web信息采集系统[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年

5 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

6 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年

7 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年

8 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年

9 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年

10 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

相关博士学位论文 前10条

1 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年

2 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年

3 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2009年

4 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年

5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年

6 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年

7 肖聚亮;建筑物迁移动力系统智能监控研究与应用[D];天津大学;2006年

8 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年

9 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年

10 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

相关硕士学位论文 前10条

1 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年

2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

3 张珍军;基于内容的图像检索技术研究[D];哈尔滨工程大学;2010年

4 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年

5 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年

6 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年

7 李健;基于内容的新闻视频检索关键技术研究[D];哈尔滨理工大学;2010年

8 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年

9 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年

10 史炜;个性化搜索引擎的研究与设计[D];电子科技大学;2010年

【二级参考文献】

相关期刊论文 前1条

1 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期

【相似文献】

相关期刊论文 前10条

1 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期

2 陶惠;张妍;郝光权;;基于向量空间的文档聚类算法分析[J];电脑知识与技术;2011年20期

3 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期

4 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期

5 朱培焱;夏栋梁;;汉英跨语言信息检索研究[J];计算机与现代化;2011年08期

6 刘勘;刘萍;;基于VSM的专家领域分析及可视化研究[J];图书情报工作;2011年10期

7 邢美凤;过仕明;;文本内容新颖性探测研究综述[J];情报科学;2011年07期

8 王萌;徐超;李春贵;何婷婷;;一种概念同现模型的多文档文摘研究[J];计算机工程与科学;2011年07期

9 李黎;阮留照;;一种合理的数字水印相似度评价公式[J];杭州电子科技大学学报;2011年03期

10 刘s,

本文编号:1771537


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1771537.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b5d8f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com