当前位置:主页 > 科技论文 > 自动化论文 >

面向新闻领域的论元因果关系判断

发布时间:2024-12-21 08:51
  互联网时代导致了人们获得的资讯中存在大量冗余的或者无意义的信息,然而很多用户使用网络的目标是希望能够清晰的了解某一件事情的“因果”,避免浏览不相关或者重复信息。除此之外,用户希望可以从繁多的网页信息中快速准确的找到自己关心的“因果”信息。那么对文本中的“因果”相关任务探究便十分必要。本文对面向新闻领域的因果关系判断方法进行了探究,首先提出了基于句子成分的论元识别方法,在得到论元的基础上提出基于句法和语义信息融合的因果关系判断方法,最后构建出的因果知识库可用于信息检索和问答等多种应用中。首先,论元识别任务是需要从输入的自然语言语句中选择出可以表达关系的两个句子成分,这里所指句子成分为一段连续的、可以表达一个完成语义的文字序列。本文将输入句子进行句法树表示,采用子树提取算法获取候选论元,选择机器学习模型进行论元识别。本文将识别出的论元对用于因果关系判断。而本文所指的因果关系判断任务主要是判别输入的两个论元之间是否存在事实性的、明确的影响,是二分类任务。分析任务的特点之后可以看出除了论元序列本身的语义信息外,输入论元的句法结构信息对因果关系判断也有影响。因此本文从两个方面进行尝试:一个是基于句...

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

图2-1例2-1的句法树表示本文使用子树提取算法获取候选论元

图2-1例2-1的句法树表示本文使用子树提取算法获取候选论元

哈尔滨工业大学硕士学位论文可以看出最大熵模型学习的主要是特征函数f(x,y)的权重。目标函数是最大熵模型的似然函数,可以通过最大似然估计参数。2.3.2基于句子成分的论元识别基于句子成分(Constitute-Based)的识别方法首先需用句法树(parsetree....


图2-2循环神经网络的神经元示意图

图2-2循环神经网络的神经元示意图

网络RNN)接神经网络结构或者卷积神经网络结构都是首先隐藏层,再将隐藏层得到的中间数据信息传递给输全部连接要么是部分连接,但事每一层内部的所有自然语言处理任务中存在一个比较常见的问题:句子具有正确的词语顺序、合理的结构、确定的语生变化就有可能破坏这种严谨的合理确定的唯一语没有办法....


图2-3LSTM记忆单元示意图

图2-3LSTM记忆单元示意图

泛的一种形式,LSTM比标准RNN在众多的方面都单的循环神经网络虽然可以很好的处理短距离(却无法较好处理长距离(long-term)依赖关系。部分推移下多次乘法操作导致的梯度爆炸或者梯度消散络能够解决RNN存在的梯度消散问题,它在反向进行传播,从而可以学习长期依赖信息。....


图 2-4 Tree-LSTM 模型结构示意图

图 2-4 Tree-LSTM 模型结构示意图

[37](数量和孩子节点数相同),图2-4是Tree-LSTM模型的结构示意图。图2-4Tree-LSTM模型结构示意图本文中给出的是二叉树结构,故有两个遗忘门。在多数应用中,可以把多叉树表示转化为二叉树。下图2-5是一个tree-LSTM记忆细胞图:图2....



本文编号:4018731

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4018731.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cdcf3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com