基于神经网络的中文命名实体识别技术研究与实现
发布时间:2021-01-07 17:21
随着网络时代的来临,互联网已成为最重要的信息载体。网络社交媒体中的文本信息量每日剧增,自然语言处理的一个重要目标就是在这些大规模数据中挖掘和理解有价值的信息。在一系列相关应用中(比如机器翻译、知识图谱、人物关系图谱),命名实体识别、实体链接等基础技术都是关键的底层技术。在文档中,命名实体(如人名、地名、公司名,地点等)是基本的信息元素,往往指示了文章的主要内容。命名实体识别的任务就是定位这些有意义的信息,并正确的标识出信息的类别属性。得到实体和实体类别后将结果传递给后续的实体消歧、实体链接工作。因此,命名实体识别是知识图谱构建、信息抽取等领域的基础技术链上最重要的关键环节之一。另外,对于文摘生成,机器翻译等很多自然语言处理任务,命名实体对于文本也有特殊地位。在文摘生成中,填充内容大多是对“谁“、“干什么”、“什么时候”、“在哪里”等问题的回答,其中一些问题刚好对应了人名、地名、时间等实体类别;在在机器翻译中,专有名词(通常为命名实体)往往由于音译(比如人名唐纳德特朗普)、历史文化等的原因更难翻译。中文命名实体识别任务总体和英文是相似的,但因为中文语言本身的特点(词汇大、需要分词、没有大...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
图2.1命名实体识别分界分类示例2.6.1 隐马尔可夫模型隐马尔可夫模型(Hidden Markov Model,简称HMM)是基于统计学的标注问题分类器模型,由隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态量生成观测量构成观测序列[23]。隐马尔可夫模型由三个关键要素:初始概率分布、状态转移分布、观测概率分布确定。图2.2隐马尔可夫模型图如图2.2,定义Q = q1, q2, . . . , qN为所有可能的隐藏状态集合,V = v1, v2, . . . , vM为所有可能的观测状态集合;H = (h1, h2, . . . , hT)为隐藏状态序列,O =
图2.1命名实体识别分界分类示例.1 隐马尔可夫模型尔可夫模型(Hidden Markov Model,简称HMM)是基于统计器模型,由隐藏的马尔可夫链随机生成不可观测的状态随机序量生成观测量构成观测序列[23]。隐马尔可夫模型由三个关键布、状态转移分布、观测概率分布确定。
本文编号:2962939
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
图2.1命名实体识别分界分类示例2.6.1 隐马尔可夫模型隐马尔可夫模型(Hidden Markov Model,简称HMM)是基于统计学的标注问题分类器模型,由隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态量生成观测量构成观测序列[23]。隐马尔可夫模型由三个关键要素:初始概率分布、状态转移分布、观测概率分布确定。图2.2隐马尔可夫模型图如图2.2,定义Q = q1, q2, . . . , qN为所有可能的隐藏状态集合,V = v1, v2, . . . , vM为所有可能的观测状态集合;H = (h1, h2, . . . , hT)为隐藏状态序列,O =
图2.1命名实体识别分界分类示例.1 隐马尔可夫模型尔可夫模型(Hidden Markov Model,简称HMM)是基于统计器模型,由隐藏的马尔可夫链随机生成不可观测的状态随机序量生成观测量构成观测序列[23]。隐马尔可夫模型由三个关键布、状态转移分布、观测概率分布确定。
本文编号:2962939
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2962939.html