当前位置:主页 > 科技论文 > 搜索引擎论文 >

语义网自动构建中句子成分识别的研究

发布时间:2018-11-02 15:27
【摘要】:互联网的迅速发展,使得世界的信息化程度越来越高。但是现在所使用的万维网无法让人满意,主要问题体现在搜索引擎智能化程度还不够。作为解决方案之一,一种新兴的主要针对于搜索数据的解决方法——语义网,它很好地体现了智能化的优点。为了构建语义网,则需要对资源描述框架进行构成。对于中文来说,构成资源描述框架的工作就是把一个句子的主谓宾成分进行提取后,利用此三元组进行语义网的自动构建工作。 依存句法分析是句法分析技术的一种。它利用语言模型、Eisner算法和最大生成树算法来构成依存句法分析的主体。通过找到和谓语动词相依存的几个组块,进一步找到句子的主语和宾语成分。利用这种方式,可以在短时间内获取结构简单句子的主谓宾成分。在此基础之上的语义角色标注是浅层语义分析的一种表现方式,通过合并句子中的各个组块,来分析它们在句子中的起到的主要作用。利用这种方法来分析句子成分有着更高的精确度。其中有关于特征的选择是两种方法的重要组成部分,对最终结果的影响占有很大比例。本文把重点放在特征的挑选上,并选择了合适的对最终结果有效的特征进行使用。利用训练好的语言模型,,进行特征的选择和匹配,使两种处理搭配得当,可以很好地找到句子中的主谓宾三元组。本系统将两种方法进行综合,改善了单纯语义角色方法所带来时间上的问题。 使用此系统在公开的未标注的语料库上进行试验,并与单纯的语义角色标注和单纯的依存语法分析的方法进行了对比,正确率高于单纯的依存分析方法,时间上低于语义角色标注的方法。
[Abstract]:With the rapid development of the Internet, the information level of the world is getting higher and higher. But the current use of the World wide Web is not satisfactory, the main problem lies in the search engine intelligence is not enough. As one of the solutions, the semantic Web, a new solution for searching data, embodies the advantages of intelligence. In order to construct the semantic web, it is necessary to construct the resource description framework. For Chinese, the task of constructing a resource description framework is to extract the subject, predicate and object components of a sentence and use the triple to construct the semantic web automatically. Dependency parsing is one of syntactic parsing techniques. It uses language model, Eisner algorithm and maximal spanning tree algorithm to construct the main body of dependency parsing. By finding several blocks that are dependent on the predicate verb, the subject and object components of the sentence are further found. In this way, the subject, predicate and object components of a simple sentence can be obtained in a short time. Semantic role tagging based on this is a representation of shallow semantic analysis. The main role of semantic role tagging in sentences is analyzed by merging the blocks in sentences. Using this method to analyze sentence components has higher accuracy. The selection of features is an important part of the two methods and has a great influence on the final results. This paper focuses on feature selection and selects suitable features that are valid for the final result. The trained language model is used to select and match the features so that the two types can be collocated properly and the subject-predicate triples in sentences can be well found. In this system, the two methods are integrated to improve the time problem caused by the simple semantic role method. The system is tested on the open unannotated corpus and compared with the methods of simple semantic role annotation and simple dependency syntax analysis. The correct rate of this system is higher than that of the simple dependency analysis method. A method in which the time is lower than the semantic role annotation.
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.1

【参考文献】

相关期刊论文 前9条

1 鞠久朋;王红玲;周国栋;;依存关系语义角色标注研究[J];计算机工程与应用;2010年14期

2 安强强;张蕾;;基于依存树的中文语义角色标注[J];计算机工程;2010年04期

3 张育;王红玲;周国栋;;基于两种句法分析的语义角色标注比较研究[J];计算机应用与软件;2010年08期

4 袁文宜;;依存语法概述[J];科技情报开发与经济;2010年18期

5 刘怀军;车万翔;刘挺;;中文语义角色标注的特征工程[J];中文信息学报;2007年01期

6 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[J];中文信息学报;2008年02期

7 周国光;汉语配价语法论略[J];南京师大学报(社会科学版);1994年04期

8 刘挺;车万翔;李生;;基于最大熵分类器的语义角色标注[J];软件学报;2007年03期

9 王文学;李芳;;基于联合方法的中文语义角色标注[J];小型微型计算机系统;2011年11期

相关博士学位论文 前1条

1 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年

相关硕士学位论文 前2条

1 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年

2 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年



本文编号:2306185

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2306185.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fc61a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com