基于自然语言处理的软件需求验证研究
发布时间:2021-06-06 05:49
随着数字化技术开始在核电站广泛应用,核电领域安全级软件的验证与确认工作,尤其是针对核安全级数字化仪控系统的软件验证与确认受到广泛关注。软件验证与确认的过程,即为软件需求与软件设计之间关系的验证与确认,贯穿于软件产品的整个生命周期。因此寻求更为简便、准确的软件需求验证方法对于核电系统技术发展以及核能的安全开发利用具有重要意义。软件需求文档中软件特性的结构完整性验证与描述合理性验证是软件验证与确认中重要的一环。论文针对自然语言处理在软件需求验证中的应用进行了较为系统的研究,主要应用了文本的词性标注以及文本相似度计算的技术,主要工作及创新点如下:1.在隐马尔科夫词性标注模型的训练中通过辅助语料采用半监督的方式不断扩展训练语料。此方法不需要大量经过标注的训练语料,通过辅助语料迭代训练的方式可以自动获得标注准确度较高的语料,节省了人力成本和时间成本。2.利用标注模型对语料进行标注时,采用Viterbi双向标注。传统隐马尔科夫标注模型只考虑了词性的单向转移,遗漏了当前词性与后续词性的关系。双向标注克服了传统隐马尔科夫模型单向依赖的缺点,同时提高了词性标注的可靠性。3.通过引入义原的深度信息改进了词...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
天气的马尔可夫链(a)和单词的马尔可夫链(b)
上海交通大学硕士学位论文-10-图2-2每天吃冰淇淋的数量和天气状态之间关系的隐马尔科夫模型Fig.2-2AhiddenMarkovmodelforrelatingnumbersoficecreamstotheweather.注意,在图2-2的HMM中,任意两种状态之间有一个(非零)过渡的概率。这样的HMM称为全连通HMM或遍历的HMM。然而,在有的HMMs中,许多状态间的转移概率为零。例如,在从左到右(也称为Bakis)的HMMs中,状态转换从左到右进行,如图2-3所示。在BakisHMM中,没有从编号较高的状态到编号较低的状态的转换(或者,更准确地说,任何从编号较高的状态到编号较低的状态的转移概率为零)。BakisHMMs通常用于模拟像语音这样的时间过程。图2-3两种隐马尔可夫模型Fig.2-3TwohiddenMarkovmodels如图2-3左边是一个从左到右(Bakis)的HMM,右边是一个全连通(遍历的)HMM。在Bakis模型中,所有未表示出的转移概率均为零。Rabiner(1989)在上世纪60年代JackFerguson所做教程的基础上提出隐马尔可夫模型由三个基本问题构成:1.概率估计问题:给定模型=(A,B,)和观测序列()12TO=o,o,...,o,计算模型λ下观测序列O出现的概率P(O|)。2.学习问题:给定一个观测序列()12TO=o,o,...,o,估计隐马尔科夫模型=(A,B,)的参数,使得在该模型下观测序列概率P(O|)最大。即,用极大似然估计的方法估计参数[16]。3.解码问题
上海交通大学硕士学位论文-11-已知模型=(A,B,)和观测序列()12TO=o,o,...,o,求使观测序列条件概率P(Q|O)最大的状态序列12(,,...,)TQ=qqq,即给定观测序列,求最有可能生成此观测序列的状态序列[17]。维特比算法维特比算法是一种利用动态规划思想的动态规划算法,该算法可以在给定模型=(A,B,)和观察序列()12TO=o,o,...,o的情况下求得使观测序列条件概率P(Q|O)最大的一组状态序列12(,,...,)TQ=qqq。例如在上述预测天气的任务中,给定观测序列(3,1,3)和一个HMM,该算法的任务就是找到与该观测序列最相符的隐状态序列。图2-4Viterbi算法计算最佳路径Fig.2-4TheViterbialgorithmforcomputingthebestpath图2-4是一个利用Viterbi算法计算观察序列3,1,3的最佳隐状态序列的一个实例,圆圈表示隐状态,方块表示观测值,白色(未填充)圆圈表示非法转移。这一过程的思路是从左到右处理观测序列,图中()tvj表示第t个观测值是由第j个隐状态产生的概率,该值通过递归产生,形式如下:
【参考文献】:
期刊论文
[1]基于模型驱动的嵌入式软件需求验证研究[J]. 杜泽民,陈宜成. 电子世界. 2018(08)
[2]基于需求的形式化建模与验证方法研究[J]. 李勇,曹子宁. 计算机技术与发展. 2017(06)
[3]核电厂DCS软件验证与确认标准体系分析[J]. 郑骈垚,钟柏,马象睿. 自动化仪表. 2017(03)
[4]浅析核安全级数字化仪控系统软件V&V的方法[J]. 叶王平,唐建中,陈卫华,谷鹏飞,王升超. 原子能科学技术. 2015(S1)
[5]现有软件验证和确认有关标准的综述[J]. 熊正隆. 核标准计量与质量. 2011(03)
[6]错误驱动学习在未登录词词性标注中的应用[J]. 梁妍,朱耀庭. 计算机工程与设计. 2008(06)
[7]词性标注中生词处理算法研究[J]. 张孝飞,陈肇雄,黄河燕,蔡智. 中文信息学报. 2003(05)
[8]基于语义计算的语句相关度研究[J]. 李素建. 计算机工程与应用. 2002(07)
本文编号:3213741
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
天气的马尔可夫链(a)和单词的马尔可夫链(b)
上海交通大学硕士学位论文-10-图2-2每天吃冰淇淋的数量和天气状态之间关系的隐马尔科夫模型Fig.2-2AhiddenMarkovmodelforrelatingnumbersoficecreamstotheweather.注意,在图2-2的HMM中,任意两种状态之间有一个(非零)过渡的概率。这样的HMM称为全连通HMM或遍历的HMM。然而,在有的HMMs中,许多状态间的转移概率为零。例如,在从左到右(也称为Bakis)的HMMs中,状态转换从左到右进行,如图2-3所示。在BakisHMM中,没有从编号较高的状态到编号较低的状态的转换(或者,更准确地说,任何从编号较高的状态到编号较低的状态的转移概率为零)。BakisHMMs通常用于模拟像语音这样的时间过程。图2-3两种隐马尔可夫模型Fig.2-3TwohiddenMarkovmodels如图2-3左边是一个从左到右(Bakis)的HMM,右边是一个全连通(遍历的)HMM。在Bakis模型中,所有未表示出的转移概率均为零。Rabiner(1989)在上世纪60年代JackFerguson所做教程的基础上提出隐马尔可夫模型由三个基本问题构成:1.概率估计问题:给定模型=(A,B,)和观测序列()12TO=o,o,...,o,计算模型λ下观测序列O出现的概率P(O|)。2.学习问题:给定一个观测序列()12TO=o,o,...,o,估计隐马尔科夫模型=(A,B,)的参数,使得在该模型下观测序列概率P(O|)最大。即,用极大似然估计的方法估计参数[16]。3.解码问题
上海交通大学硕士学位论文-11-已知模型=(A,B,)和观测序列()12TO=o,o,...,o,求使观测序列条件概率P(Q|O)最大的状态序列12(,,...,)TQ=qqq,即给定观测序列,求最有可能生成此观测序列的状态序列[17]。维特比算法维特比算法是一种利用动态规划思想的动态规划算法,该算法可以在给定模型=(A,B,)和观察序列()12TO=o,o,...,o的情况下求得使观测序列条件概率P(Q|O)最大的一组状态序列12(,,...,)TQ=qqq。例如在上述预测天气的任务中,给定观测序列(3,1,3)和一个HMM,该算法的任务就是找到与该观测序列最相符的隐状态序列。图2-4Viterbi算法计算最佳路径Fig.2-4TheViterbialgorithmforcomputingthebestpath图2-4是一个利用Viterbi算法计算观察序列3,1,3的最佳隐状态序列的一个实例,圆圈表示隐状态,方块表示观测值,白色(未填充)圆圈表示非法转移。这一过程的思路是从左到右处理观测序列,图中()tvj表示第t个观测值是由第j个隐状态产生的概率,该值通过递归产生,形式如下:
【参考文献】:
期刊论文
[1]基于模型驱动的嵌入式软件需求验证研究[J]. 杜泽民,陈宜成. 电子世界. 2018(08)
[2]基于需求的形式化建模与验证方法研究[J]. 李勇,曹子宁. 计算机技术与发展. 2017(06)
[3]核电厂DCS软件验证与确认标准体系分析[J]. 郑骈垚,钟柏,马象睿. 自动化仪表. 2017(03)
[4]浅析核安全级数字化仪控系统软件V&V的方法[J]. 叶王平,唐建中,陈卫华,谷鹏飞,王升超. 原子能科学技术. 2015(S1)
[5]现有软件验证和确认有关标准的综述[J]. 熊正隆. 核标准计量与质量. 2011(03)
[6]错误驱动学习在未登录词词性标注中的应用[J]. 梁妍,朱耀庭. 计算机工程与设计. 2008(06)
[7]词性标注中生词处理算法研究[J]. 张孝飞,陈肇雄,黄河燕,蔡智. 中文信息学报. 2003(05)
[8]基于语义计算的语句相关度研究[J]. 李素建. 计算机工程与应用. 2002(07)
本文编号:3213741
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3213741.html
最近更新
教材专著