基于词向量的初等数学问题题意理解
发布时间:2019-10-17 20:26
【摘要】:近几年来,随着人工智能的发展,生活上的方方面面都变得更加智能化。而在教育领域,如何让人工智能的力量更好的服务于人类的教育是一个十分有意义的课题。要让计算机能够个性化辅导和自动解题,首先要解决的就是让计算机理解人类所使用的数学语言,才能实现计算机自动推理和自动解题。本文主要研究了初等数学领域中题意理解的关键方法,包括初等数学语言的特点及其知识表示方法,初等数学的词的表示方法,数学短文本的特征提取及特征构造方法,基于分类思想的题意理解过程和数学文本的预处理方法等内容。由于初等数学语言有别于普通自然语言的特殊性,要研究初等数学题意中的数学语言,就不能直接使用处理普通自然语言的已有的方法。相对于普通自然语言,数学语言中包含了大量的符号、公式、专有名词等普通自然语言没有的内容,所以要做好初等数学的题意理解就必须针对这些特性对普通的自然语言处理方法做出改进。本文主要研究工作如下:1、首先详细分析了初等数学语言的特点,并根据其特点和设计了一种简单,高效的初等数学知识表示方法。1)在词的表示层面,本文深入研究在自然语言领域已经取得较好效果的开源工具word2vec中的模型和算法,继而在此基础上针对数学语言的特点对其提出了对数学领域中的关键词加权等一些列的改进,使其更适合表示数学语言中的词。2)在句子的表示层面,通过将语义层面的特征和数学实体层面的两种特征结合起来的方法表示数学短文本。两种特征的协同表达,使其对数学短句子的特征表达更充分,更有利于后续工作。2、在题意理解的方法上,本文另辟蹊径的将数学题意理解问题转化为了数学短文的分类问题,使得问题简单化,可以根据已有的方法很好的解决未知的问题。在数学短文本分类方面,根据语义和数学实体的协同特征向量的特点,本文将两种已有的分类算法结合并加以改进,提出了一种适合数学文本分类的分类算法。3、在题意理解的具体流程上,首先设计针对初等数学领域的文本预处理方法,继而通过词向量和数学实体构造特征向量,接着进行数学短文本的分类,最后生成对应的知识表示。并将实现的系统用在初等数学题目自动求解的系统中。基于以上方法,本文设计与实现了一个初等数学题意理解系统。并通过对比实验证明此系统在初等数学题意理解方面取得了较好的效果。
【图文】:
电子科技大学硕士学位论文馈神经网络在处理数据时,只关心当前状态的输入,没有办法获特征。所以,在处理与时间或者序列相关的信息时,除非把上一前时刻的信息一起输入网络,,否则是没有能力获取描述时间信RNN 不同,这种网络本身的结构在设计的时候就将时序特征包中的处理单元,与它连接的不仅仅是当前时刻的输入层,还会与单元连接。它是一个反馈动态系统,RNN 每次处理当前时刻的来以便下一个时间的使用。因此,RNN 每次在处理信息时,都面几个时刻的处理信息和状态信息。基于以上特性,RNN 相对网络,更具有对动态信息的计算和拟合能力。 2-1 是 RNN 的结构图:
直接将句子按照自然状态下的标点符号进,对于数学语言描述的长文本中的标点符号部分是不需要作为切分标志。而且长文本那些不作为切分标志的标点往往集中在坐上下文特征。,本文的断句方法基于序列标注的思想,通切分标志的标点标记出来。对于一个序列标自动标注的模型。:由于此处的文本切分任务可以视作针对所以标签只有两种:表示要切分的“Y”和:由于长文本中的两个切分标记之间包含之间都包含了完整的分词结果,命名实体结,还加入分词的边界特征和命名实体的边界列如图 3-2 所示:
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O12;TP391.1
本文编号:2550752
【图文】:
电子科技大学硕士学位论文馈神经网络在处理数据时,只关心当前状态的输入,没有办法获特征。所以,在处理与时间或者序列相关的信息时,除非把上一前时刻的信息一起输入网络,,否则是没有能力获取描述时间信RNN 不同,这种网络本身的结构在设计的时候就将时序特征包中的处理单元,与它连接的不仅仅是当前时刻的输入层,还会与单元连接。它是一个反馈动态系统,RNN 每次处理当前时刻的来以便下一个时间的使用。因此,RNN 每次在处理信息时,都面几个时刻的处理信息和状态信息。基于以上特性,RNN 相对网络,更具有对动态信息的计算和拟合能力。 2-1 是 RNN 的结构图:
直接将句子按照自然状态下的标点符号进,对于数学语言描述的长文本中的标点符号部分是不需要作为切分标志。而且长文本那些不作为切分标志的标点往往集中在坐上下文特征。,本文的断句方法基于序列标注的思想,通切分标志的标点标记出来。对于一个序列标自动标注的模型。:由于此处的文本切分任务可以视作针对所以标签只有两种:表示要切分的“Y”和:由于长文本中的两个切分标记之间包含之间都包含了完整的分词结果,命名实体结,还加入分词的边界特征和命名实体的边界列如图 3-2 所示:
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O12;TP391.1
【参考文献】
相关期刊论文 前10条
1 张利娟;;人工智能让生活更便捷[J];中国报道;2016年04期
2 张志昌;周慧霞;姚东任;鲁小勇;;基于词向量的中文词汇蕴涵关系识别[J];计算机工程;2016年02期
3 王芳;;自然语言逻辑的产生与人工智能中的知识表示[J];福建农林大学学报(哲学社会科学版);2015年05期
4 张建明;詹智财;成科扬;詹永照;;深度学习的研究与发展[J];江苏大学学报(自然科学版);2015年02期
5 陈晓康;刘竹松;;基于改进Kd-Tree构建算法的k近邻查询[J];广东工业大学学报;2014年03期
6 徐大明;;语言是人类的信息工具[J];琼州学院学报;2014年04期
7 高俊伟;孔芳;朱巧明;李培峰;;基于SVM的中文名词短语指代消解研究[J];计算机科学;2012年10期
8 孙茂松;;基于互联网自然标注资源的自然语言处理[J];中文信息学报;2011年06期
9 曹玉娟;牛振东;赵X;彭学平;;基于概念和语义网络的近似网页检测算法[J];软件学报;2011年08期
10 张润;;中学数学基本思想方法归纳与总结[J];基础教育论坛;2010年09期
相关会议论文 前1条
1 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
相关硕士学位论文 前1条
1 张春燕;基于自然语言处理的文本分类分析与研究[D];江西理工大学;2011年
本文编号:2550752
本文链接:https://www.wllwen.com/kejilunwen/yysx/2550752.html