当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于依存句法分析的语义三元组构建的研究与实现

发布时间:2017-06-04 15:02

  本文关键词:基于依存句法分析的语义三元组构建的研究与实现,由笔耕文化传播整理发布。


【摘要】:随着互联网的迅速发展,知识和信息量开始呈现爆炸式的增长趋势,而搜索引擎的智能化程度却与人们的实际需求相差甚远。目前,万维网联盟提出了一种新兴的、具有智能化优点的语义网。对于汉语来说,语义网构造的核心任务就是提取句子的语义三元组成分。本论文的主要研究内容是自然语言处理中句法分析的理论和相关方法,利用依存句法分析的方法来构建汉语复杂长句的语义三元组,即主语,谓语和宾语。语义三元组的提取为自动构建语义网奠定了基础。 汉语长句具有语序灵活多变、依存关系复杂的特点,本文采用构造根搜索器的方法将长句划分成两个短句,然后分别对两个简单短句进行依存句法分析。本课题选用长句较多的哈工大汉语依存树库作为实验的训练和测试语料库。首先,利用JAVA的DOM4j方法将哈工大树库从XML格式转换成TXT格式。然后,利用支持向量机方法对长句的结点词进行训练并预测根结点。本课题选用LIBSVM作为二值分类器构造根搜索器的模型,提取与根结点信息相关的特征,并进行了对比实验分析,找出影响根搜索器性能的最优特征组合。最后,,为避免Arc-eager算法进行长距离依存关系分析时的贪婪性问题,将Arc-eager依存分析算法和支持向量机方法结合对短句进行依存句法分析,提取语义三元组成分并对1000个长句和分割后形成的1981个短句进行了对比实验分析,分别获得两者的依存关系准确率。 理论分析和实验结果表明,先构造根结点搜索器,然后将长句划分成短句,并对短句进行依存分析,最后提取语义三元组中的根结点、主谓关系和动宾关系的准确率比原始长句的准确率高。
【关键词】:根结点搜索器 依存句法分析 支持向量机 语义三元组
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 绪论10-17
  • 1.1 课题的背景及意义10-11
  • 1.2 国内外研究动态11-14
  • 1.2.1 国外研究动态11-12
  • 1.2.2 国内研究动态12-14
  • 1.3 论文主要研究内容14-15
  • 1.4 论文组织结构15-17
  • 第二章 依存语法与依存句法分析概述17-28
  • 2.1 依存语法理论17-19
  • 2.2 依存结构形式19-20
  • 2.3 依存句法分析方法20-25
  • 2.3.1 各种依存句法的分析比较22-23
  • 2.3.2 Arc-eager 决策式依存句法分析算法23-25
  • 2.4 语料库25-27
  • 2.4.1 国外语料库25
  • 2.4.2 汉语语料库25-27
  • 2.5 本章小结27-28
  • 第三章 机器学习模型28-36
  • 3.1 机器学习在句法分析中的应用28-29
  • 3.2 支持向量机模型29-35
  • 3.2.1 支持向量机的理论基础29-32
  • 3.2.2 多类划分的方法32-34
  • 3.2.3 LIBSVM34-35
  • 3.3 本章小结35-36
  • 第四章 汉语长句根结点搜索器的构造36-47
  • 4.1 前期工作36-37
  • 4.2 构造根结点搜索器37-46
  • 4.2.1 汉语长句分析的难点37-38
  • 4.2.2 根搜索器的构造38-40
  • 4.2.3 实验结果及分析40-46
  • 4.3 本章小结46-47
  • 第五章 汉语子句句法分析及三元组的构造47-60
  • 5.1 分句进行句法分析48-52
  • 5.1.1 依存句法分析模型49-50
  • 5.1.2 依存句法分析算法及过程描述50-52
  • 5.2 提取长句的语义三元组52-53
  • 5.3 实验结果及分析53-59
  • 5.3.1 评价标准53-54
  • 5.3.2 数据特征选取54-55
  • 5.3.3 实验结果分析55-59
  • 5.4 本章小结59-60
  • 第六章 结论60-61
  • 参考文献61-64
  • 在学研究成果64-65
  • 致谢65

【参考文献】

中国博士学位论文全文数据库 前1条

1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年


  本文关键词:基于依存句法分析的语义三元组构建的研究与实现,由笔耕文化传播整理发布。



本文编号:421294

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/421294.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户488bd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com