自然语言处理在挖掘概念传递特征中的应用研究
发布时间:2021-07-16 07:30
自然语言处理(NLP)被广泛应用于不同的研究领域,包括文本分词、语音识别、文本信息的处理、人工智能等,对文本中名词或短语的处理是NLP研究的重要内容。名词或短语研究的主要目标之一是探讨将传统的关键词和句法方法、语义方法相结合的可能性,以提高信息处理与分析的质量。大规模开放在线课程(MOOC)为大众提供了丰富的学习资源,并且MOOC讨论区成为学生和教师之间进行深入互动的主要交流途径。因此,讨论区中适当长度的学生-助教的讨论对于MOOC讨论区的提问者和观察者来说尤其宝贵。本文利用NLP技术深入挖掘MOOC讨论区中学生-助教问答文本(学生问、助教答)信息,提出了一种挖掘问答文本概念传递特征的自然语言处理方法。本文利用Stanford Word Segmenter对问答文本分词,再用Stanford POS Tagger标注问答文本词性,提取问答文本中的名词(即概念),将文本中提取的概念通过语言知识库HowNet/WordNet得到每个概念对应的上位概念。然后结合网络分析工具UCInet、文本分析工具CRIE/Coh-Metrix,将概念传递过程视为一个有向图建模。选取平均路径长度、语义具体度...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.1?WordNet中soprano的上下位关系表示??HowNet和WordNet在描述概念采用的方法有些不同,但是这两者有着明显的??
文本信息中数据的“大小”和“形式”多种多样,在提取文本中的特征时重要??的一点就是结构化数据,一般把文本中没有经过处理的原始数据转换成结构化数据,??然后借助一些工具,来得到有效信息的过程称为信息提取,如下图2.2,展示了一种??基本的提取文本信息特征的系统结构。它首先借助一些句子分割工具把文本内容分??成句子,其次是分词、词性标注、实体识别(识别文本中实体之间可能存在的关系)、??12??
3.i?流程??为了研宄问答文本概念传递特征,本文提出了一个挖掘文本概念传递特征的自??然语言处理流程,如图3.1。??I?a—_I?I?I??!丨学生-助教语料1?J丨-问答-文本綱iiTj?I??!?|科学家语料|?]?]?|文本去停用调]??I?|发言人语料?!?T?一""'??■?J?|?*?n??厂?文本处理?;??I???I??I?文本分词?丨??I?i?I?:■■」?■?I??!?|词性标注?提取概念丨??1?????I??I?1??概念传递特征挖掘??——rz:一」…一in一一一??I?HowNet/WordNet?!?厂?CRIE/Coh-Metrix?]?I?U?Cl?net??I?||?j?I????[|语义具体度|?|?|?|可读性|?j?[?|平均路径长度j??1?!?|?1?LSASSl?|?|?I?|?出?/入度?|?;??I?I?i?J??图3.1挖掘文本概念传递特征的流程图??如图3.1所示,文本概念传递特征的挖掘流程由预处理、文本处理、概念传递??特征挖掘三个部分组成。??第一部分,文本的预处理首先从获得的学生-助教、科学家、发言人语料数据中??整理出问答文本,一个问答文本即一个提问和一个对应的回答,然后再过滤问答文??本的停用词。??第二部分,文本处理过程是先借助Stanford?Word?Segmenter分词,再用Stanford??POS?Tagger标注词性,然后结合HowNet/WorldNet提取问答文本的概念特征。??第三部分
【参考文献】:
期刊论文
[1]文本可读性的自动分析研究综述[J]. 吴思远,蔡建永,于东,江新. 中文信息学报. 2018(12)
[2]基于词联接的自然语言处理改进技术研究[J]. 赵栋材,周雁. 计算机与网络. 2018(09)
[3]科学探究的问答逻辑及其博弈模型[J]. 颜中军. 佛山科学技术学院学报(社会科学版). 2017(04)
[4]系统功能语法视角下美国新闻发言人语言特点研究[J]. 安凤. 现代交际. 2017(02)
[5]面向自然语言处理的深度学习研究[J]. 奚雪峰,周国栋. 自动化学报. 2016(10)
[6]科学家参与科学传播守则——浅析《科学家与媒体交流指南》[J]. 高健,陈玲,张会亮. 科普研究. 2015(05)
[7]基于知识图谱的中外自然语言处理研究的对比分析[J]. 邱均平,方国平. 现代图书情报技术. 2014(12)
[8]在线社会网络的测量与分析[J]. 徐恪,张赛,陈昊,李海涛. 计算机学报. 2014(01)
[9]概念图理论在移动学习资源设计中的应用研究[J]. 李浩君,项静,吴亮亮. 中国远程教育. 2013(07)
[10]概念图在小学作文教学中应用的实验研究[J]. 曹培杰,王济军,李敏,何克抗. 电化教育研究. 2013(05)
硕士论文
[1]基于HowNet的个性化学习系统的研究与设计[D]. 张珺昱.江西师范大学 2016
本文编号:3286574
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.1?WordNet中soprano的上下位关系表示??HowNet和WordNet在描述概念采用的方法有些不同,但是这两者有着明显的??
文本信息中数据的“大小”和“形式”多种多样,在提取文本中的特征时重要??的一点就是结构化数据,一般把文本中没有经过处理的原始数据转换成结构化数据,??然后借助一些工具,来得到有效信息的过程称为信息提取,如下图2.2,展示了一种??基本的提取文本信息特征的系统结构。它首先借助一些句子分割工具把文本内容分??成句子,其次是分词、词性标注、实体识别(识别文本中实体之间可能存在的关系)、??12??
3.i?流程??为了研宄问答文本概念传递特征,本文提出了一个挖掘文本概念传递特征的自??然语言处理流程,如图3.1。??I?a—_I?I?I??!丨学生-助教语料1?J丨-问答-文本綱iiTj?I??!?|科学家语料|?]?]?|文本去停用调]??I?|发言人语料?!?T?一""'??■?J?|?*?n??厂?文本处理?;??I???I??I?文本分词?丨??I?i?I?:■■」?■?I??!?|词性标注?提取概念丨??1?????I??I?1??概念传递特征挖掘??——rz:一」…一in一一一??I?HowNet/WordNet?!?厂?CRIE/Coh-Metrix?]?I?U?Cl?net??I?||?j?I????[|语义具体度|?|?|?|可读性|?j?[?|平均路径长度j??1?!?|?1?LSASSl?|?|?I?|?出?/入度?|?;??I?I?i?J??图3.1挖掘文本概念传递特征的流程图??如图3.1所示,文本概念传递特征的挖掘流程由预处理、文本处理、概念传递??特征挖掘三个部分组成。??第一部分,文本的预处理首先从获得的学生-助教、科学家、发言人语料数据中??整理出问答文本,一个问答文本即一个提问和一个对应的回答,然后再过滤问答文??本的停用词。??第二部分,文本处理过程是先借助Stanford?Word?Segmenter分词,再用Stanford??POS?Tagger标注词性,然后结合HowNet/WorldNet提取问答文本的概念特征。??第三部分
【参考文献】:
期刊论文
[1]文本可读性的自动分析研究综述[J]. 吴思远,蔡建永,于东,江新. 中文信息学报. 2018(12)
[2]基于词联接的自然语言处理改进技术研究[J]. 赵栋材,周雁. 计算机与网络. 2018(09)
[3]科学探究的问答逻辑及其博弈模型[J]. 颜中军. 佛山科学技术学院学报(社会科学版). 2017(04)
[4]系统功能语法视角下美国新闻发言人语言特点研究[J]. 安凤. 现代交际. 2017(02)
[5]面向自然语言处理的深度学习研究[J]. 奚雪峰,周国栋. 自动化学报. 2016(10)
[6]科学家参与科学传播守则——浅析《科学家与媒体交流指南》[J]. 高健,陈玲,张会亮. 科普研究. 2015(05)
[7]基于知识图谱的中外自然语言处理研究的对比分析[J]. 邱均平,方国平. 现代图书情报技术. 2014(12)
[8]在线社会网络的测量与分析[J]. 徐恪,张赛,陈昊,李海涛. 计算机学报. 2014(01)
[9]概念图理论在移动学习资源设计中的应用研究[J]. 李浩君,项静,吴亮亮. 中国远程教育. 2013(07)
[10]概念图在小学作文教学中应用的实验研究[J]. 曹培杰,王济军,李敏,何克抗. 电化教育研究. 2013(05)
硕士论文
[1]基于HowNet的个性化学习系统的研究与设计[D]. 张珺昱.江西师范大学 2016
本文编号:3286574
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3286574.html
最近更新
教材专著