基于海量文本的企业行为识别及行为关系发现
发布时间:2022-01-04 03:17
实体在自然语言处理中表示语言描述的对象,例如商业新闻中的企业和旅行游记中的景点等。隐藏在文本中的实体关系具有极大的价值,例如企业关系可以辅助决策,景点关系可以帮助推荐等。因此从文本中发现实体关系成为了一项极具管理意义的工作。在传统的实体关系抽取研究中,研究者们主要是依据实体之间的共现关系进行。这样抽取出的关系是异质的,即抽取出的关系不一定是同一类关系,然而更紧密的同质关系更能体现实体间的联系。假设我们建立企业的关系是因为他们的某种具体行为,而不是仅仅因为他们出现在同一篇新闻稿中。那么在构建出的网络中,实体的关系将更加紧密,从而使得后续分类或预测工作的准确度更高。抽取同质关系主要面临三个挑战:首先,同质关系在网络文本中的存在很稀疏。其次,文档包含的实体未知。最后,语料包含的关系集合和文档对应的标签也未知。针对以上挑战,本文着手在互联网的海量文本中进行企业关系的预测。我们需要分别解决实体识别和行为抽取两个问题,并以此来对实体的同质关系进行建模。本文关注的第一个问题是实体名识别——需要去探究文档中字(词)元素组成实体名的可能性。本文将该问题转化为一个复合词识别问题。本文提出了一种度量候选样本...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
马蜂窝网站的游记部分截图
虾米音乐歌曲“憨人”评论展示
微博信息举例
本文编号:3567548
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
马蜂窝网站的游记部分截图
虾米音乐歌曲“憨人”评论展示
微博信息举例
本文编号:3567548
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3567548.html
最近更新
教材专著