一种基于语义理解的元搜索引擎的研究
本文关键词: 语义理解 网页特征库 元搜索引擎 出处:《计算机工程》2006年07期 论文类型:期刊论文
【摘要】:通过对查询短语的结构分析,发现查询短语通常由关键词和特征词构成。特征词是对网页内容的概括,它预示着网页中包含一组特定的特征词条。基于该思想建立了面向Web网页内容的特征库。以元搜索引擎为研究对象,研究了以Web网页内容特征库为基础实现对查询短语进行语义理解的方法,提出了相关度级别的算法,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。
[Abstract]:By analyzing the structure of the query phrase, it is found that the query phrase is usually composed of keywords and feature words. It indicates that the web page contains a set of specific feature entries. Based on this idea, a feature library for the content of Web pages is established. The meta-search engine is used as the research object. This paper studies the method of semantic understanding of query phrases based on Web content feature library, proposes an algorithm of correlation level, and tests the features that have been collected in the database, and the precision is 86.7%. The experiment shows that, This model basically realizes the understanding of the query phrase, and has remarkable effect on improving the precision of search engine.
【作者单位】: 河北经贸大学计算机中心 河北经贸大学计算机中心
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 何凤英;;基于语义理解的中文博文倾向性分析[J];计算机应用;2011年08期
2 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期
3 康旭珍;李茹;李双红;;框架元素语义核心词自动识别研究[J];中文信息学报;2011年04期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前10条
1 吴晨;张全;缪建明;韦向峰;;自然语言语义理解下的信息检索模型[A];第三届学生计算语言学研讨会论文集[C];2006年
2 靳光瑾;;计算机理解汉语需要语法理论支撑[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋春阳;;从字到字组的语义解释模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 ;SWCL-2006日程安排(分)[A];第三届学生计算语言学研讨会论文集[C];2006年
6 董静;孙乐;吕元华;冯元勇;;基于线性链条件随机场模型的语义角色标注[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
8 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
9 卢达;浦炜;陈金星;谢铭培;;一种基于模糊逻辑的字符印刷结构归类法[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
10 许洁萍;吕士楠;闫俐;;汉语语音合成系统可用性研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
相关重要报纸文章 前4条
1 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
2 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
3 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
4 工业和信息化部 通信科技委委员 侯自强;物联网仅仅才开始[N];计算机世界;2009年
相关博士学位论文 前3条
1 刘楠;视频广告内容分析与理解[D];北京交通大学;2012年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 刘亚楠;多模态特征融合和变量选择的视频语义理解[D];浙江大学;2010年
相关硕士学位论文 前10条
1 胡文静;基于语义理解与PLSA的文本情感分类研究[D];天津师范大学;2012年
2 游宇;基于本体的科技资源搜索引擎设计与实现[D];复旦大学;2008年
3 李先岭;基于识别的公式编辑器的研究和开发[D];西南交通大学;2009年
4 皇甫东;手绘草图理解的隐马尔可夫模型方法[D];天津大学;2006年
5 毋琳;特定领域问答系统中通用语义理解框架的设计与实现[D];河南大学;2007年
6 倪茂树;基于语义理解的观点评论挖掘研究[D];大连理工大学;2007年
7 游春晖;基于语义情感倾向的文本相似度计算[D];电子科技大学;2008年
8 周震;基于语义的知识资源搜索与集成研究[D];东华大学;2010年
9 李志辉;基于专业知网的中文智能答疑系统模型研究[D];西南大学;2006年
10 张宏伟;基于语义理解的编程题自动评分系统的研究与实现[D];大连海事大学;2010年
,本文编号:1521408
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1521408.html