基于本体的作战文书分词的关键技术研究
发布时间:2021-06-07 01:23
随着“信息化”军事作战时代的到来,单纯人工处理海量的作战文书已经远远不能满足信息提取的快速性和正确性的要求,那么人们希望计算机能像人脑一样具有“逻辑思维”并且“理解”作战文书的内容。众所周知,作战文书是由连续的、没有分隔符的中文字符串组成的,而计算机理解功能的最底层处理单位是词,因此对作战文书进行分词是关键性技术,这一步骤处理的正确与否直接影响对作战文书的后续处理——词性标注、语法分析、关键信息提取、地图的态势标注等,甚至可以决定作战文书理解的成败。因此,对于作战文书的分词研究是一项重要的课题。本文针对作战文书的记述特点,进行的主要研究工作和取得的成果如下:(1)详细介绍了中文分词理论和应用系统的发展历程,并论述了进行作战文书分词研究的重要性和必要性。(2)主要从基于单字和基于词的两种不同类别概述了汉语分词技术的理论研究,并且分析了应用在常见分词系统中的分词算法,通过分析,明确了歧义问题和新词识别是阻碍中文分词技术发展的两个关键问题。(3)鉴于作战文书的格式及其内容的多样性,引入具有语义关系的本体技术,利用OWL本体描述语言来描述本体,同时,采用斯坦福大学开发的Protégé软件来构建...
【文章来源】:杭州电子科技大学浙江省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
“骨架法”本体构建流程图
杭州电子科技大学硕士学位论文表态用语同意、批准、可行、准予、不同意、不予批准、应予否定、应予修改执行、暂不执行、照此办理承办用语办理、施行、执行、承办、交办、阅办、协办、查办、查处、试行、自行、暂行、拟办、办复、缓办、落实、贯彻、按期、定期、议定、决定、拟定综合过渡用语 为此、据此、鉴此、因此、总之、综上所述、有鉴于此、据悉、为使3.4 作战文书领域本体构建根据前一章节提到的本体基础理论,并且结合作战文书的特点,构建适用于军事领域的本体。作战文书的内容涉及到作战准备、作战部署、作战指挥、作战协同、作战保障等,几乎涵盖了所有的军事领域的基本信息,从作战文书内容这一现实需要着手,构建军事领域本体的主要步骤概略如图 3.1 所示:
侦察机→(ASN-104无人侦察机,运-8侦察机,EP-3E电子侦察机,RB一47侦察机,……)该部分实例的关系如图3.5所示:图 3.5 军事装备的部分实例及关系(4)给军事领域概念添加属性关系在本体中,概念通常包含两种属性,对象类型属性和数据类型属性,在软件Protégé 中分别用 Object Property 和 Datatype Property 表示。在通常情况下,属性包含四大类:属性名称(Property name)、定义域(Domain)、值域(Range)和公理(Axtiom)。1)属性名称:概念具有的属性的一般称谓。2)定义域:该属性适用的范围。3)值域:对象类型属性的值域是实例,而数据类型属性的值域是 string、double、int、boole 等。29
【参考文献】:
期刊论文
[1]基于知网的汉语普通未登录词语义分析模型[J]. 张瑞霞,杨国增,闫新庆. 计算机应用与软件. 2012(08)
[2]浅析军队作战文书写作特点[J]. 李纯. 应用写作. 2011(03)
[3]有限状态机在中文文本分词中的应用[J]. 火善栋. 现代计算机(专业版). 2010(06)
[4]一种基于字词联合解码的中文分词方法[J]. 宋彦,蔡东风,张桂平,赵海. 软件学报. 2009(09)
[5]基于GML的时空地理本体模型构建及应用研究[J]. 宋佳,诸云强,王卷乐,李锐. 地球信息科学学报. 2009(04)
[6]基于隐马尔科夫模型的中文术语识别研究[J]. 岑咏华,韩哲,季培培. 现代图书情报技术. 2008(12)
[7]语义网服务中的本体综述[J]. 史一民,李冠宇,刘宁. 计算机工程与设计. 2008(23)
[8]自动术语识别——对科技文献进行文本挖掘的重要技术方法[J]. 刘建华,张智雄,徐健,许雁冬. 现代图书情报技术. 2008(08)
[9]基于隐马尔科夫模型的中文分词研究[J]. 魏晓宁. 电脑知识与技术(学术交流). 2007(21)
[10]机器学习及其相关算法综述[J]. 陈凯,朱钰. 统计与信息论坛. 2007(05)
硕士论文
[1]一种中文未登录词识别及词典设计新方法[D]. 魏莎莎.西南大学 2011
[2]基于机器学习的中文分词的研究与实现[D]. 崔明明.沈阳工业大学 2009
[3]基于OWL的本体进化研究[D]. 张子振.中国海洋大学 2007
本文编号:3215553
【文章来源】:杭州电子科技大学浙江省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
“骨架法”本体构建流程图
杭州电子科技大学硕士学位论文表态用语同意、批准、可行、准予、不同意、不予批准、应予否定、应予修改执行、暂不执行、照此办理承办用语办理、施行、执行、承办、交办、阅办、协办、查办、查处、试行、自行、暂行、拟办、办复、缓办、落实、贯彻、按期、定期、议定、决定、拟定综合过渡用语 为此、据此、鉴此、因此、总之、综上所述、有鉴于此、据悉、为使3.4 作战文书领域本体构建根据前一章节提到的本体基础理论,并且结合作战文书的特点,构建适用于军事领域的本体。作战文书的内容涉及到作战准备、作战部署、作战指挥、作战协同、作战保障等,几乎涵盖了所有的军事领域的基本信息,从作战文书内容这一现实需要着手,构建军事领域本体的主要步骤概略如图 3.1 所示:
侦察机→(ASN-104无人侦察机,运-8侦察机,EP-3E电子侦察机,RB一47侦察机,……)该部分实例的关系如图3.5所示:图 3.5 军事装备的部分实例及关系(4)给军事领域概念添加属性关系在本体中,概念通常包含两种属性,对象类型属性和数据类型属性,在软件Protégé 中分别用 Object Property 和 Datatype Property 表示。在通常情况下,属性包含四大类:属性名称(Property name)、定义域(Domain)、值域(Range)和公理(Axtiom)。1)属性名称:概念具有的属性的一般称谓。2)定义域:该属性适用的范围。3)值域:对象类型属性的值域是实例,而数据类型属性的值域是 string、double、int、boole 等。29
【参考文献】:
期刊论文
[1]基于知网的汉语普通未登录词语义分析模型[J]. 张瑞霞,杨国增,闫新庆. 计算机应用与软件. 2012(08)
[2]浅析军队作战文书写作特点[J]. 李纯. 应用写作. 2011(03)
[3]有限状态机在中文文本分词中的应用[J]. 火善栋. 现代计算机(专业版). 2010(06)
[4]一种基于字词联合解码的中文分词方法[J]. 宋彦,蔡东风,张桂平,赵海. 软件学报. 2009(09)
[5]基于GML的时空地理本体模型构建及应用研究[J]. 宋佳,诸云强,王卷乐,李锐. 地球信息科学学报. 2009(04)
[6]基于隐马尔科夫模型的中文术语识别研究[J]. 岑咏华,韩哲,季培培. 现代图书情报技术. 2008(12)
[7]语义网服务中的本体综述[J]. 史一民,李冠宇,刘宁. 计算机工程与设计. 2008(23)
[8]自动术语识别——对科技文献进行文本挖掘的重要技术方法[J]. 刘建华,张智雄,徐健,许雁冬. 现代图书情报技术. 2008(08)
[9]基于隐马尔科夫模型的中文分词研究[J]. 魏晓宁. 电脑知识与技术(学术交流). 2007(21)
[10]机器学习及其相关算法综述[J]. 陈凯,朱钰. 统计与信息论坛. 2007(05)
硕士论文
[1]一种中文未登录词识别及词典设计新方法[D]. 魏莎莎.西南大学 2011
[2]基于机器学习的中文分词的研究与实现[D]. 崔明明.沈阳工业大学 2009
[3]基于OWL的本体进化研究[D]. 张子振.中国海洋大学 2007
本文编号:3215553
本文链接:https://www.wllwen.com/kejilunwen/jingguansheji/3215553.html