从Web中获取部分整体关系
本文关键词: 部分整体关系 知识获取 关系获取 出处:《中文信息学报》2013年02期 论文类型:期刊论文
【摘要】:随着互联网的迅速发展,Web逐步成为知识获取的重要资源。部分整体关系获取是知识获取中的重要组成部分。该文提出了一种利用搜索引擎从Web中获取部分整体关系的方法。首先构造一种基于部分整体关系分类的意图查询,利用意图查询可以有针对性地从Web中获取尽可能多的包含部分整体关系语料。然后根据网页中的HTML标记和意图查询的格式过滤语料,并从中抽取候选部分整体关系,最后基于部分整体关系在自然语言表述中的特点和汉语的构词规律,提出用于验证候选部分整体关系的度量标准。实验结果表明,该方法取得了较高的准确率和F值。在前20个结果中准确率为86%,最优F值为64%。
[Abstract]:With the rapid development of the Internet, web has gradually become an important resource for knowledge acquisition. Partial whole relationship acquisition is an important part of knowledge acquisition. In this paper, a search engine is proposed to obtain part of the whole from Web. First of all, we construct a kind of intention query based on partial global relationship classification. Using intention query, we can get as many parts of the whole relational corpus as possible from the Web. Then we filter the corpus according to the HTML tags and the format of the intention query, and extract the candidate part of the whole relationship from it. Finally, based on the characteristics of partial global relations in natural language expression and the rule of word formation in Chinese, a metric for verifying candidate partial global relations is proposed. The experimental results show that, In the first 20 results, the accuracy rate is 86 and the optimal F value is 64.
【作者单位】: 中国科学院计算技术研究所;中国科学院大学;
【基金】:国家自然科学基金资助项目(91224006,61173063,61035004,30973713,61203284) 国家社会科学基金资助项目(10AYY003)
【分类号】:TP391.1
【参考文献】
相关期刊论文 前1条
1 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
【共引文献】
相关期刊论文 前9条
1 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
2 陈丽,于浩,郑德权,赵铁军;基于文本内容的超链接分类研究[J];哈尔滨商业大学学报(自然科学版);2004年02期
3 郑庆华,王朝静,孙霞;一种基于结构化语料库的概念语义网络自动生成算法[J];计算机研究与发展;2005年03期
4 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统[J];计算机工程与应用;2007年09期
5 张虎,郑家恒,刘江;语料库词性标注一致性检查方法研究[J];中文信息学报;2004年05期
6 康海燕,李彦芳,林培光,樊孝忠;信息检索策略性能的云模型评价方法[J];中文信息学报;2005年01期
7 吕碧波;赵军;;基于相关文档池建模的查询扩展[J];中文信息学报;2006年03期
8 左家莉,王明文,王希;基于Markov网络的信息检索扩展模型[J];清华大学学报(自然科学版);2005年S1期
9 李智,李敏强;基金项目评审管理中智能交互式文档检索[J];研究与发展管理;2005年03期
相关会议论文 前3条
1 熊文新;宋柔;;信息检索查询语句的表述分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
2 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
3 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年
相关博士学位论文 前6条
1 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
2 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
3 潘旭伟;集成情境知识管理中几个关键技术的研究[D];浙江大学;2005年
4 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
5 王树西;基于文本模式推理的问答系统研究[D];中国科学院研究生院(计算技术研究所);2005年
6 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
相关硕士学位论文 前10条
1 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
2 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
3 吴炜;基于用户日志的信息检索研究[D];同济大学;2006年
4 张波;个性化Web搜索系统研究[D];燕山大学;2006年
5 谭伟;面向网络的中文问答系统相关技术的研究与系统初步实现[D];清华大学;2005年
6 范重庆;基于动态知识库的高考咨询问答系统研究[D];华中师范大学;2006年
7 陈玉;基于事实性问题中文问答系统的研究与实现[D];山西大学;2006年
8 谢翠华;基于概念格的Web文本管理研究[D];扬州大学;2006年
9 盛俊;潜在语义的Markov网络检索模型的研究[D];江西师范大学;2006年
10 文勖;中文问答系统中问题分类及答案候选句抽取的研究[D];哈尔滨工业大学;2006年
【二级参考文献】
相关期刊论文 前2条
1 崔桓,蔡东风,苗雪雷;基于网络的中文问答系统及信息抽取算法研究[J];中文信息学报;2004年03期
2 袁毓林;计算语言学的理论方法和研究取向[J];中国社会科学;2001年04期
相关会议论文 前1条
1 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
相关期刊论文 前10条
1 钱揖丽,郑家恒;文本切分知识获取及其应用[J];计算机工程与应用;2003年02期
2 陶贵明;张锡恩;;基于运动仿真的故障知识获取研究[J];微计算机信息;2006年07期
3 章纪顺;张洁;;基于粗糙集的数据挖掘及其在知识获取中的应用[J];浙江工贸职业技术学院学报;2007年04期
4 丁德恒;;大规模数据库中的知识获取[J];计算机科学;1994年05期
5 钟佩思,高国安;智能CAD系统中的知识表示与知识获取策略[J];中国机械工程;1999年03期
6 林波;薛惠锋;苗治平;;网络组织知识获取模型及其仿真分析[J];情报杂志;2009年11期
7 邹志鹏;饶若楠;;一种面向非结构化信息的知识获取框架[J];微型电脑应用;2010年08期
8 姚金国;代志龙;;基于文本分析的知识获取系统设计与实现[J];计算机工程;2011年02期
9 张f,
本文编号:1550117
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1550117.html