当前位置:主页 > 科技论文 > 软件论文 >

面向大学生的教学秘书问答系统研究

发布时间:2019-04-03 09:55
【摘要】:在电脑普及、信息爆炸的现代社会,网络已经成为主流咨询媒介。目前,高校大学生学习、生活、娱乐之类的咨询主要通过现场、电话咨询和网络咨询等方式,而涉及到的这些问题往往具有离散、量大、重复、时间跨度长等特点。因此,如何利用互联网技术,建立科学、合理的网络问答服务体系,以此减轻老师回答重复或类似问题的工作强度,这具有重要的现实意义。这就是本文解决问题的产生源头。论文的工作主要是研究面向大学生的教学秘书问答系统,实现部分代替人工解答学生问题,给学生提供一种更方便、更快捷的解惑释疑新途径。为了提高问答准确率,论文以学生日常管理问题域为例,在相对封闭的问题域中,展开应用研究,但这些方法是可以向相关问题域进行扩展的。针对论文的教学秘书问答系统,学生可以通过普通的文本问句,向该系统发问,系统将能及时返回一个答案或明确回答可以回答的其他途径,从而能显著提高学生问题的求解效率。本文主要涉及的热点技术有自然语言处理、知识库的构建,其中自然语言处理是其核心。此处自然语言处理是指如何有效地提高前期收集到的原始文档数据的分类处理效率、如何有效地提高用户问句与问答知识库中语句的匹配率,这是本文的研究重点。论文包括以下5个部分内容:(1)研究现状综述。介绍了问答系统与问答机器人的研究现状,以及论文涉及的文本表示、基于《知网》的词语语义相似度算法以及文本相似度算法的研究现状,并分析了相关领域的文本数据特点和数据预处理方法。(2)改进文本表示方法,以此提高前期收集到的原始文档数据集的分类效率。基于文本向量空间模型,改进了该模型涉及到的特征词项权重算法idftf-。针对其仅考虑特征词项与文档之间关系,引入特征词项选择中的卡方统计值和词性因子,以此弥补原始算法忽略特征词项区分文本类别的不足,从而获得文本向量空间模型的改进模型。利用收集到的原始文档数据集进行分类验证,结果证明改进的文本表示方法是有效性的。(3)改进词语语义相似度算法,以此提高用户问句与问答知识库中语句的匹配率。系统选用基于《知网》语义词典的方法,发现现有词语语义相似度计算方法未考虑义原距离与义原深度的主次关系,对义原相似度的结果产生较大负面影响,因此,本文提出通过约束深度因素,获得义原相似度算法的改进方法。论文从理论和实验两方面对其进行了验证,结果证明该方法是有效性的。(4)进一步改进词语语义相似度算法。论文提出了以词语间第一基本义原相似度最高的概念组合为计算对象,并引入动态加权因子实现对词语语义相似度算法的改进。利用学生问题测试集和知识库中候选问题集进行文本相似度计算,实验结果证明改进的词语语义相似度算法提高了系统返回答案的准确率。(5)研制基于知识库的教学秘书问答系统。利用整理后的学生日常管理领域文本数据,并基于《知网》建立大学生日常管理的、狭窄的领域知识库,标注实例解释,并成功应用于论文的教学秘书问答系统。
[Abstract]:......
【学位授予单位】:重庆理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 张小川;于旭庭;张宜浩;;一种改进的向量空间模型的文本表示算法[J];重庆理工大学学报(自然科学);2017年01期

2 王有华;陈笑蓉;;基于Kolmogorov复杂性的文本聚类算法改进[J];计算机科学;2016年05期

3 史朋亮;;知识管理服务的实践和探索——以中国知网为例[J];科技与出版;2016年05期

4 廖志芳;周国恩;李俊锋;刘飞;蔡飞;;中文短文本语法语义相似度算法[J];湖南大学学报(自然科学版);2016年02期

5 柔特;;藏文问答系统中问句的分类方法研究[J];计算机工程与科学;2015年07期

6 ZENG Jianqiu;YANG Mengke;;Internet Plus and Networks Convergence[J];中国通信;2015年04期

7 张沪寅;刘道波;温春艳;;基于《知网》的词语语义相似度改进算法研究[J];计算机工程;2015年02期

8 魏楚元;湛强;樊孝忠;毛煜;张大奎;;融合事件信息的中文问答系统问题语义表征[J];中文信息学报;2015年01期

9 王小林;王东;杨思春;邰伟鹏;郑啸;;基于《知网》的词语语义相似度算法[J];计算机工程;2014年12期

10 张超;孔芳;周国栋;;交互式问答系统中待消解项的识别方法研究[J];中文信息学报;2014年04期

相关博士学位论文 前2条

1 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年

2 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年

相关硕士学位论文 前10条

1 刘英涛;短文本分类研究[D];重庆理工大学;2016年

2 陈红阳;中文微博话题发现技术研究[D];重庆理工大学;2015年

3 张倩;基于半监督学习的中文短文本分类研究[D];西安电子科技大学;2014年

4 葛丽萍;交互式问答系统中的待改进问题自动识别方法[D];哈尔滨工业大学;2013年

5 张科;基于《知网》义原空间的文本相似度计算研究与实现[D];重庆大学;2013年

6 强继朋;FAQ问答系统中的问句相似度研究[D];合肥工业大学;2013年

7 余龙龙;短消息文本处理关键技术研究[D];西南财经大学;2013年

8 马强;基于布尔模型和扩展布尔模型的中文信息检索系统[D];辽宁科技大学;2012年

9 李国佳;汉语全文相似度计算的研究及应用[D];电子科技大学;2011年

10 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年



本文编号:2453116

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2453116.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4c6bb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com