中文文本的信息自动抽取和相似检索机制
发布时间:2018-09-11 09:10
【摘要】:目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.
[Abstract]:At present, information extraction has become an important means to provide high quality information service. An automatic extraction and similar retrieval mechanism for Chinese text information is proposed. The basic idea is to express user interest as semantic template and expand the concept of keywords. On the basis of concept trigger mechanism and partial analysis technology, the candidate text set is obtained by search engine. Based on the mapping mechanism of semantic relation to template slot, the text semantic template is filled in to form a structured text database. Based on the fuzziness of text data representation, the similarity relationship between user query and text semantic template is given, and the similarity retrieval is realized, which can meet the information needs of users more comprehensively.
【作者单位】: 大连理工大学计算机系 大连理工大学计算机系 大连理工大学计算机系
【基金】:国家自然科学基金项目(6037309560673039)资助.
【分类号】:TP391.1
[Abstract]:At present, information extraction has become an important means to provide high quality information service. An automatic extraction and similar retrieval mechanism for Chinese text information is proposed. The basic idea is to express user interest as semantic template and expand the concept of keywords. On the basis of concept trigger mechanism and partial analysis technology, the candidate text set is obtained by search engine. Based on the mapping mechanism of semantic relation to template slot, the text semantic template is filled in to form a structured text database. Based on the fuzziness of text data representation, the similarity relationship between user query and text semantic template is given, and the similarity retrieval is realized, which can meet the information needs of users more comprehensively.
【作者单位】: 大连理工大学计算机系 大连理工大学计算机系 大连理工大学计算机系
【基金】:国家自然科学基金项目(6037309560673039)资助.
【分类号】:TP391.1
【参考文献】
相关期刊论文 前1条
1 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
【共引文献】
相关期刊论文 前10条
1 高迎,王丽君,王锡钢;Simutem:一个中文信息检索系统[J];鞍山师范学院学报;2001年03期
2 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
3 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
4 朱靖波,陈文亮;基于FIFA的主题相似性计算模型[J];东北大学学报(自然科学版);2003年11期
5 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报(自然科学版);2005年08期
6 朱靖波,王宝库,姚天顺;一种规则描述语言NPRDL语言[J];东北大学学报(自然科学版);1996年06期
7 张月杰,姚天顺;英汉机译中基于相似性与猜测规则识别未登录词[J];东北大学学报(自然科学版);1998年06期
8 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报(自然科学版);1999年03期
9 林鸿飞,高仁t,
本文编号:2236258
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2236258.html