基于迷惑度的错误选项自动生成算法研究
发布时间:2021-12-29 22:36
选择类型的题目是人们设计各类考试或问答节目的常见形式。人们在设计有多个选项的选择题时,需要同时给出正确选项和若干迷惑选项。迷惑选项在确保自身错误性的同时,还需与问题或正确选项具备一定的语义相关性以保证其迷惑性。错误性和相关性的双重要求使得迷惑选项的设计通常需要人们花费大量的时间和精力。因此,如果能够设计一种算法针对给定的问题自动生成若干可供选择的迷惑选项,将有效提高人们设计选择题的效率。传统的自动问答系统(Automatic Question Answering System,QA)能够根据用户提出的自然语言形式的问题返回给用户简洁的、自然语言形式的正确答案。但问答系统技术仅关注正确答案的生成,很难提供错误选项。本文针对单选类型的选择题,提出了用于评价迷惑选项的迷惑度。迷惑度表示在给定问题和一个正确选项的前提下,一个错误选项被测试者可能判断为正确选项的程度。在此基础之上,本文进而设计了一种基于迷惑度的迷惑选项生成算法(Generation of Confusing Options based on Confusion Degree,COG)。该算法使用深度学习技术,从迷惑选项与问题之间...
【文章来源】:南京邮电大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
迷惑选&WordNetGloVeNER
南京邮电大学硕士研究生学位论文第三章基于迷惑度的错误选项自动生成21度值。用WordNet、GloVe和NER[65]计算数据库中答案的语义相关度;最后,通过选择机制选出迷惑度最高的选项,并与正确答案和问题相结合形成多项选择题。图3.1迷惑选项生成模型图迷惑选项生成模型结构图如图3.1所示。用户输入任意问题后,通过QA系统的候选答案集生成迷惑选项以及问题的数据集。对数据集里的迷惑选项采用WordNet、GloVe、NER三种方法计算语义相关度,将这三种方法所算得的三个语义相关度进行加权得出一个最终的迷惑度值。最后通过选择机制选出迷惑度最高的前几个迷惑选项与正确答案和问题相结合生成选择题。3.3.2迷惑度算法考虑到3.2.2节所提到的迷惑度计算的三个因素:迷惑选项和问题之间的语义相关度、迷惑选项和正确答案之间的语义相关度以及迷惑选项的类型和正确答案的类型是否匹配,就可以进行迷惑度计算公式的设计。如果将迷惑选项和问题之间的语义相关度的值设置为),迷惑选项和正确答案之间的语义相关度的值设置为*,运用NER判断的迷惑选项和正确答案是否属于同一类别的值设置为N。那么可以设计出如式3.1所示迷惑度计算公式:Con=[)+(1)*](3.1)式3.1中,参数的最合适的取值需要通过进一步的实验来确定。&WordNetGloVeNERTopN
WN1&GV2迷惑度对比曲线图
【参考文献】:
期刊论文
[1]基于word2vec的网站主题分类研究[J]. 程元堃,蒋言,程光. 计算机与数字工程. 2019(01)
[2]基于词向量特征扩展的中文短文本分类研究[J]. 雷朔,刘旭敏,徐维祥. 计算机应用与软件. 2018(08)
[3]基于Word2Vec的中文短文本分类问题研究[J]. 汪静,罗浪,王德强. 计算机系统应用. 2018(05)
[4]文本相似度计算方法研究综述[J]. 陈二静,姜恩波. 数据分析与知识发现. 2017(06)
[5]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[6]基于TFIDF算法的关键词提取方法[J]. 章志华,陆海良,郁钢. 信息技术与信息化. 2015(08)
[7]基于TF统计和语法分析的关键词提取算法[J]. 战学刚,吴强. 计算机应用与软件. 2014(01)
[8]WordNet中的综合概念语义相似度计算方法[J]. 王桐,王磊,吴吉义,徐贺. 北京邮电大学学报. 2013(02)
[9]Web问答系统中问句理解的研究[J]. 苏斐,高德利,叶晨. 测试技术学报. 2012(03)
[10]基于概念间边权重的概念相似性计算方法[J]. 冯永,张洋. 计算机应用. 2012(01)
硕士论文
[1]面向关联数据的实体对齐方法研究[D]. 李琳.北京化工大学 2017
[2]基于word2vec词向量的文本分类研究[D]. 朱磊.西南大学 2017
[3]自动问答系统的研究与实现[D]. 李清.安徽大学 2012
[4]汉语句子相似度计算及其在自动问答系统中的应用[D]. 吴全娥.西南大学 2011
[5]基于课程知识的问答系统研究与应用[D]. 刘祥.大连海事大学 2010
[6]相似度计算在基于本体的自动问答系统中的应用[D]. 杨志国.中央民族大学 2010
本文编号:3556971
【文章来源】:南京邮电大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
迷惑选&WordNetGloVeNER
南京邮电大学硕士研究生学位论文第三章基于迷惑度的错误选项自动生成21度值。用WordNet、GloVe和NER[65]计算数据库中答案的语义相关度;最后,通过选择机制选出迷惑度最高的选项,并与正确答案和问题相结合形成多项选择题。图3.1迷惑选项生成模型图迷惑选项生成模型结构图如图3.1所示。用户输入任意问题后,通过QA系统的候选答案集生成迷惑选项以及问题的数据集。对数据集里的迷惑选项采用WordNet、GloVe、NER三种方法计算语义相关度,将这三种方法所算得的三个语义相关度进行加权得出一个最终的迷惑度值。最后通过选择机制选出迷惑度最高的前几个迷惑选项与正确答案和问题相结合生成选择题。3.3.2迷惑度算法考虑到3.2.2节所提到的迷惑度计算的三个因素:迷惑选项和问题之间的语义相关度、迷惑选项和正确答案之间的语义相关度以及迷惑选项的类型和正确答案的类型是否匹配,就可以进行迷惑度计算公式的设计。如果将迷惑选项和问题之间的语义相关度的值设置为),迷惑选项和正确答案之间的语义相关度的值设置为*,运用NER判断的迷惑选项和正确答案是否属于同一类别的值设置为N。那么可以设计出如式3.1所示迷惑度计算公式:Con=[)+(1)*](3.1)式3.1中,参数的最合适的取值需要通过进一步的实验来确定。&WordNetGloVeNERTopN
WN1&GV2迷惑度对比曲线图
【参考文献】:
期刊论文
[1]基于word2vec的网站主题分类研究[J]. 程元堃,蒋言,程光. 计算机与数字工程. 2019(01)
[2]基于词向量特征扩展的中文短文本分类研究[J]. 雷朔,刘旭敏,徐维祥. 计算机应用与软件. 2018(08)
[3]基于Word2Vec的中文短文本分类问题研究[J]. 汪静,罗浪,王德强. 计算机系统应用. 2018(05)
[4]文本相似度计算方法研究综述[J]. 陈二静,姜恩波. 数据分析与知识发现. 2017(06)
[5]基于Word2Vec的一种文档向量表示[J]. 唐明,朱磊,邹显春. 计算机科学. 2016(06)
[6]基于TFIDF算法的关键词提取方法[J]. 章志华,陆海良,郁钢. 信息技术与信息化. 2015(08)
[7]基于TF统计和语法分析的关键词提取算法[J]. 战学刚,吴强. 计算机应用与软件. 2014(01)
[8]WordNet中的综合概念语义相似度计算方法[J]. 王桐,王磊,吴吉义,徐贺. 北京邮电大学学报. 2013(02)
[9]Web问答系统中问句理解的研究[J]. 苏斐,高德利,叶晨. 测试技术学报. 2012(03)
[10]基于概念间边权重的概念相似性计算方法[J]. 冯永,张洋. 计算机应用. 2012(01)
硕士论文
[1]面向关联数据的实体对齐方法研究[D]. 李琳.北京化工大学 2017
[2]基于word2vec词向量的文本分类研究[D]. 朱磊.西南大学 2017
[3]自动问答系统的研究与实现[D]. 李清.安徽大学 2012
[4]汉语句子相似度计算及其在自动问答系统中的应用[D]. 吴全娥.西南大学 2011
[5]基于课程知识的问答系统研究与应用[D]. 刘祥.大连海事大学 2010
[6]相似度计算在基于本体的自动问答系统中的应用[D]. 杨志国.中央民族大学 2010
本文编号:3556971
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3556971.html
最近更新
教材专著