基于SVM的识别初等数学中相对运动应用题的研究
发布时间:2017-08-29 15:14
本文关键词:基于SVM的识别初等数学中相对运动应用题的研究
【摘要】:自上世纪五十年代以来人工智能领域经历近七十年的发展,已然有颇丰的成果,机器解答数学习题正是建立在前人的累累硕果之上的前沿研究。机器解答数学应用题需要经过题目读入、题目理解、机器解答和类人输出这一系列的步骤。本论文中的题目理解是指对输入的应用题在文本分类和信息抽取方法的途径上建立题目的数量关系组。这样的题目理解方法首先需要识别出给定题目的题目类型,再根据识别出的类型,抽取和添加相应的数量关系,其中包含直陈述关系和隐含关系。题目类型识别,还可用于将分类好的题目交由与之对应的特定解题框架进行求解。本论文所做的工作为应用题的分类识别,具体而言,是采用基于支持向量机SVM分类的方法,识别一个给定的应用题是否为相对运动应用题。为了实现这一目标,本文构建了数学题目类型识别器,识别器基于SVM算法,通过对数学应用题题目样本进行训练建构预测模型,从而对未知数学应用题题目样本集进行分类预测,实现了识别给定的习题是否是相对运动应用题的功能。本文的主要研究工作如下:第一,本文研究了数学应用题中隐含关系提取的一个具体问题,在机器解答数学应用题过程中需不需要添加相对运动的公式,即判断应用题是否为相对运动应用题。通过对输入的训练题目文本集进行分词,用词袋法对抽取的特征进行特征向量表示,训练好学习模型后读入测试样本,用同样的方法对测试样本进行向量化。最终利用SVM分类算法对题目文本是否为相对运动问题进行判断与识别。第二,本文将从初级中学权威教辅材料中收集的数学应用题组成测试集,进行实证研究,通过实验验证了该分类模型的性能。最后的实验效果显示该题目文本分类器模型能以100%的正确率识别给定初等数学中应用题是否是相对运动应用题。
【关键词】:文本分类 机器解答 SVM
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G434;G633.6
【目录】:
- 摘要5-6
- Abstract6-11
- 第一章 绪论11-19
- 1.1 研究背景及意义11-13
- 1.2 国内外研究现状13-17
- 1.2.1 机器解答的研究现状14-15
- 1.2.2 文本分类的研究现状15-16
- 1.2.3 支持向量机(SVM)的应用现状16-17
- 1.3 本文的工作和组织结构17-19
- 第二章 相关理论基础19-29
- 2.1 文本分类19-22
- 2.1.1 文本分类概述19-21
- 2.1.2 文本分类的任务21
- 2.1.3 文本分类的过程21-22
- 2.2 统计学习理论22-24
- 2.2.1 机器学习定义22-23
- 2.2.2 经验风险最小化原理23
- 2.2.3 结构风险最小化原理23-24
- 2.3 支持向量机24-27
- 2.3.1 最优分类面25
- 2.3.2 核函数25-27
- 2.3.3 松弛变量27
- 2.4 本章小结27-29
- 第三章 基于支持向量机的题目类别识别器的设计与实现29-34
- 3.1 机器解答概述29-30
- 3.2 系统模型30-31
- 3.3 详细设计31-33
- 3.3.1 训练32
- 3.3.2 预测32-33
- 3.4 本章小结33-34
- 第四章 数学应用题题目样本预处理与向量化表示34-40
- 4.1 文本的预处理方法34-35
- 4.1.1 文本分词技术35
- 4.1.2 停用词处理35
- 4.2 文本表示理论35-36
- 4.3 实验样本预处理和向量化表示36-40
- 4.3.1 数学应用题题目样本预处理36-38
- 4.3.2 数学应用题题目样本向量化表示38-40
- 第五章 相对运动应用题识别器特征选择40-45
- 5.1 文本特征选择方法40-43
- 5.1.1 IG信息增益法40-41
- 5.1.2 特征词的频率法DF41-42
- 5.1.3 互信息法MI42
- 5.1.4 CHI统计法42-43
- 5.2 实验特征选择43-45
- 第六章 实验与分析45-56
- 6.1 题型识别器实验样本45-47
- 6.1.1 训练样本46
- 6.1.2 测试样本46
- 6.1.3 题库文本46-47
- 6.2 题型识别器实验步骤47-54
- 6.2.1 训练过程47-51
- 6.2.2 测试过程51-54
- 6.3 题型识别器的实验结果及性能评价54-55
- 6.3.1 文本分类的性能评价标准54-55
- 6.3.2 题型识别器的性能评价55
- 6.4 本章小结55-56
- 第七章 总结及展望56-58
- 7.1 总结56
- 7.2 展望56-58
- 参考文献58-61
- 攻读硕士期间发表的论文61-62
- 致谢62
【参考文献】
中国期刊全文数据库 前2条
1 杨胜,施鹏飞;Bidirectional Automated Branch and Bound Algorithm for Feature Selection[J];Journal of Shanghai University;2005年03期
2 忻栋,杨莹春,吴朝晖;基于SVM-HMM混合模型的说话人确认[J];计算机辅助设计与图形学学报;2002年11期
,本文编号:753976
本文链接:https://www.wllwen.com/jiaoyulilunlunwen/753976.html