当前位置:主页 > 科技论文 > 搜索引擎论文 >

从Web获取部分整体关系语料的方法

发布时间:2019-12-02 05:09
【摘要】:部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。
【图文】:

信息图,关系语,查询方法,方法


询串关键词的部分标记为红字,我们用斜体黑体表示这些匹配的部分。图1中比较三种不同方法中获取的部分整体关系语料中,含有部分整体关系语句的数量。由于人工构造查询方法获取的部分整体关系语料是一种完全非结构化的,因此不能利用查询串提供的信息自动获取其中的部分整体关系。图2对比基于语料库构造查询方法和意图查询方法获取的部分整体关系数量。4.3 实验分析从图1可以看出,在由返回的Top100项、Top200项、Top300项、Top400项和Top500项检索结果组成的部分整体关系语料中,人工构造查询方法所获取的各个语料中蕴含部分整体关系的语句数量最少,意图查询方法获取数量最多,且部分整体关系语料的规模越大,意图查询方法的优势越明显。图1 三种不同方法获取的语料中含有部分整体关系的语句的数量在部分整体关系抽取难易方面

语义图,信息图,查询方法,关系语


对于这种语料,我们能很容易的利用查询串本身提供的信息,从中抽取出符合我们查询本意的部分整体关系。通过图2中的实验数据可以看出,对比基于语料库构造查询方法,意图查询方法从获取的部分整体关系语料中可以多获取大约两倍的部分整体关系。5 结束语目前人们使用搜索引擎作为从Web获取知识的有效手段,但网上绝大多数搜索引擎都使用基于关键词匹配的全文检索技术,不支持语义搜索。因为不易对检索对象本身做出处理[4],我们只能对查询串本身做出某些改变,使其接近我们需要的语义。故本文提出了一种新的用于从Web获取部分整体关系语料的基于意图的查询构造方法即意图查询方法。在查询中加入与部分整体相关度高的语境词,构造新的查询

【共引文献】

相关期刊论文 前8条

1 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期

2 陈丽,于浩,郑德权,赵铁军;基于文本内容的超链接分类研究[J];哈尔滨商业大学学报(自然科学版);2004年02期

3 郑庆华,王朝静,孙霞;一种基于结构化语料库的概念语义网络自动生成算法[J];计算机研究与发展;2005年03期

4 张虎,郑家恒,刘江;语料库词性标注一致性检查方法研究[J];中文信息学报;2004年05期

5 康海燕,李彦芳,林培光,樊孝忠;信息检索策略性能的云模型评价方法[J];中文信息学报;2005年01期

6 吕碧波;赵军;;基于相关文档池建模的查询扩展[J];中文信息学报;2006年03期

7 左家莉,王明文,王希;基于Markov网络的信息检索扩展模型[J];清华大学学报(自然科学版);2005年S1期

8 李智,李敏强;基金项目评审管理中智能交互式文档检索[J];研究与发展管理;2005年03期

相关博士学位论文 前3条

1 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年

2 潘旭伟;集成情境知识管理中几个关键技术的研究[D];浙江大学;2005年

3 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

相关硕士学位论文 前9条

1 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年

2 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年

3 吴炜;基于用户日志的信息检索研究[D];同济大学;2006年

4 张波;个性化Web搜索系统研究[D];燕山大学;2006年

5 谢翠华;基于概念格的Web文本管理研究[D];扬州大学;2006年

6 盛俊;潜在语义的Markov网络检索模型的研究[D];江西师范大学;2006年

7 余超;基于知网的词汇语义计算研究及应用[D];沈阳航空工业学院;2007年

8 藕军;Deep Web搜索引擎的关键技术[D];合肥工业大学;2007年

9 冯运;信息检索中的查询算法研究[D];湖南大学;2007年

【二级参考文献】

相关期刊论文 前1条

1 袁毓林;计算语言学的理论方法和研究取向[J];中国社会科学;2001年04期



本文编号:2568651

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2568651.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa029***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com