当前位置:主页 > 科技论文 > 软件论文 >

自动作文评分模型及方法研究

发布时间:2019-01-16 09:30
【摘要】:写作作为语言考试的一种必备题型,通常需要大规模的作文阅卷,采用人工评分的方法一方面浪费大量的人力、物力,另一方面,人工评分依赖阅卷老师的主观判断,存在一定误差。随着自然语言处理技术的发展,其在句法分析,语义分析、情感分析等方面取得了突破性的进展,利用自然语言处理技术对作文进行自动评分具有重要的意义。传统的自动作文评分方法主要对整篇文章进行统计,提取词法、句法、语义等特征,代入机器学习模型中进行训练,从而预测评分,这种方法通常依赖于人工提取的规则特征,并且只简单的考虑篇章整体质量,没有很好的考虑到其中更细节的信息,比如篇章的上下文信息等。基于这些问题,本文在传统评分方法上,进一步抽取句子层面的特征,并利用篇章的上下文的时序信息,挖掘作文潜在的逻辑性、连贯性对评分模型的影响。另外,针对语言考试中规定题目的写作情景,从考察作文是否符合题意角度出发,研究了作文主题相关度在评分模型中的效果。本文的研究内容主要包括以下三个方面:(1)研究了句表示方法和深度学习模型在自动作文评分中的应用。在写作这个特定情境下,作文更适合看作具备逻辑性的语句序列,为了挖掘句子之间隐藏的逻辑信息,本文主要使用无监督的方法表示句向量,其中包括Doc2Vec技术、递归自编码器等。然后使用深度学习方法构建模型,本文主要基于CNN模型在提取特征上的优势和LSTM模型适合时序性问题的特点,设计并实现了多种模型结构,找到适合该问题的建模方法。并与传统评分模型进行融合,使评分模型效果得到提升。(2)研究了说明文体裁作文的主题相关度在评分问题中的作用。主要通过提取题目文本与作文文本之间的相似度特征,并引入基于主题的语义离散度的概念,分析其对最终评分结果的影响。(3)设计并实现了一个作文自动评分系统。该系统能够对作文质量给出及时的评分反馈,并且在词法、句法、逻辑、主题角度给出相关的反馈。并增加了纠错模块,可以一定程度上提供给用户更好的写作反馈体验。
[Abstract]:As a necessary type of language test, writing usually requires a large scale composition marking. On the one hand, manual scoring method wastes a lot of manpower and material resources, on the other hand, manual scoring depends on the subjective judgment of the marking teacher. There is a certain error. With the development of natural language processing technology, it has made a breakthrough in syntactic analysis, semantic analysis, emotional analysis and so on. It is of great significance to use natural language processing technology to score composition automatically. The traditional automatic composition scoring method mainly carries on the statistics to the entire article, extracts the lexical, syntactic, semantic and so on characteristic, and substitutes in the machine learning model to train, thus predicts the score, this kind of method usually depends on the manual extraction rule characteristic. Furthermore, the overall quality of the text is simply considered, and the more detailed information, such as the context of the text, is not well considered. Based on these problems, this paper extracts the features of sentence level in the traditional scoring method, and uses the temporal information of the context of the text to explore the potential logic and coherence of the composition to influence the scoring model. In addition, according to the writing situation of the prescribed topic in the language test, the effect of the relevance of the composition theme in the scoring model is studied from the point of view of whether the composition conforms to the meaning of the question. The main contents of this paper are as follows: (1) the application of sentence representation and depth learning model in automatic composition scoring is studied. In the particular situation of writing, composition is more suitable to be regarded as a logical sentence sequence. In order to mine the hidden logic information between sentences, this paper mainly uses an unsupervised method to express sentence vectors, including Doc2Vec technology. Recursive self-encoder, etc. Based on the advantages of CNN model in extracting features and the characteristics of LSTM model suitable for temporal problem, this paper designs and implements a variety of model structures to find a modeling method suitable for this problem. And fusion with the traditional scoring model to improve the effectiveness of the scoring model. (2) this paper studies the role of theme relevance in the scoring problem of genre writing. By extracting the similarity feature between title text and composition text, and introducing the concept of topic based semantic dispersion, this paper analyzes its influence on the final score result. (3) A composition automatic scoring system is designed and implemented. The system can give timely scoring feedback on composition quality, and give related feedback in lexical, syntactic, logical and thematic perspectives. An error correction module is added to provide users with a better writing feedback experience to a certain extent.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 马小涵;;创新推动作文图书繁荣发展[J];出版参考;2009年06期

2 刘汇力;;学作文与学做人[J];新闻与写作;1984年01期

3 张伟;;作文图书的买方市场[J];出版广角;1999年12期

4 景琳;作文图书的必由之路[J];编辑之友;2002年03期

5 岳金秀;如何在作文教学中培养学生的素质[J];甘肃科技纵横;2005年03期

6 丁玲;;希望在这里——喜读《学作文报》[J];新闻与写作;1984年01期

7 陈明宏;系统·开放·辩证——读《中学作文训练体系和方法》[J];中国图书评论;1991年05期

8 ;《新高考》作文读本系列图书[J];新高考(高三理化生);2014年02期

9 ;《新高考》作文读本系列图书[J];新高考(高三理化生);2014年03期

10 施青濒;;“小学专题作文”的探索与实践[J];现代教学;2005年12期

相关会议论文 前10条

1 仲梅;;有关作文教学的几点体会[A];江苏省教育学会、江苏省写作学会2006年年会论文集[C];2006年

2 彭庆;孙坚;;作文与做人[A];江苏省教育学会、江苏省写作学会2006年年会论文集[C];2006年

3 林莉;;浅谈中学研究性作文教学的内涵与特点[A];江苏省教育学会、江苏省写作学会2006年年会论文集[C];2006年

4 向水林;;作文教学要着眼素质开启心理[A];首届“健康杯”全国中小学心理健康教育研讨暨颁奖大会论文集[C];2002年

5 刘彦;;积累感动 净化灵魂——用心灵相互取暖,用感动经营作文[A];中国管理科学文献[C];2008年

6 徐迎春;任德成;;绿色作文——作文教学的新境界——浅谈初一作文教学[A];国家教师科研专项基金科研成果(语文建设卷2)[C];2013年

7 吴永尧;;浅谈高中语文教学中的作文教学[A];中华教育理论与实践科研论文成果选编(第七卷)[C];2014年

8 李彩萍;;守望精神交流的家园——作文教学随想[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年

9 王有寿;;作文教学应注意的几个环节[A];萃英集——青海省教育委员会、青海省教育学会优秀教育论文集[C];2000年

10 唐秀华;;“反作文”引发的思考[A];山东省师范教育学会2002年度师范教育研究优秀成果论文集[C];2002年

相关重要报纸文章 前10条

1 记者 王国平;作文训练要从“诚善美”出发[N];光明日报;2009年

2 山东省临沭第二中学 季春娟;在作文中提升学生的做人素养[N];学知报;2010年

3 崇左市江洲区和平中学 甘必争;作文讲评之我见[N];学知报;2011年

4 阳信县第二高级中学 何忠;作文教学[N];学知报;2011年

5 盐城市亭湖区步凤中学 李玉钧;一种新的作文教学模式:快乐作文[N];学知报;2011年

6 洛阳市新安县职业高中 王丽红;走出作文教学的困境[N];学知报;2011年

7 李支舜 华东师大一附中语文特级教师;作文应是个性化的表达[N];文汇报;2013年

8 栗洪武 陕西师范大学教育学院;加强习字和作文训练 应对写作危机蔓延[N];中国社会科学报;2013年

9 江苏省海安高级中学 杭礼宏;突破“作文难”困境[N];中国教师报;2014年

10 本报记者 杨咏梅 南京师大附中语文教研组长 王栋生;“反作文”反出真作文[N];中国教育报;2001年

相关博士学位论文 前4条

1 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年

2 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年

3 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年

4 王q,

本文编号:2409699


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2409699.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6c161***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com