基于文本分类的信息解析研究
发布时间:2021-12-25 00:08
信息解析在自然语言处理中是一项极具重要性和挑战性的工作,同时也在自然语言处理应用中扮演着重要的角色。例如:舆情监控、网络搜索和智能问答等。近年来,随着深度学习的不断发展,信息解析在自然语言处理中的研究取得了丰富的研究成果,并且已经在工程上实现了广泛的应用。但是在某些方面还存在一些不足之处,如有监督的深度学习方法需要大量高质量的人工标注的训练数据,其过程十分的耗时耗力,以及在中文文本中,文本数据会出现分词的歧义性、单个中文字符表达的意思不准确和不丰富,和在不同情况下,中文的词语和字符在句子中的重要性不一样的情况,导致了信息解析在工程应用中存在一些问题。为了解决上述问题,本文首先提出新的主动学习方法,并且将其与深度学习方法相结合;其次融合不同权重的中文词语级别的特征和字符级别的特征,使得模型最终的结果可以同时考虑到词语级别特征和字符级别特征。本文针对基于文本分类的信息解析进行了相关研究,主要工作如下:(1)提出了一个新的主动学习方法,并将其与深度学习方法相结合去实现信息解析。有监督的深度学习模型在训练过程中通常需要大量高质量的、已标注的训练样本数据。通过人工来得到这样的样本数据是繁琐的、不...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图3.2卷积神经网络结构图??Figure?3.2?The?structure?diagram?of?convolutional?neural?network??
图4.7企业公告数据集上的实验结果??Figure?4.7?Experimental?results?on?the?Enterprise?announcement?dataset??
【参考文献】:
期刊论文
[1]基于Spark框架的高效KNN中文文本分类算法[J]. 于苹苹,倪建成,姚彬修,李淋淋,曹博. 计算机应用. 2016(12)
[2]信息抽取研究综述[J]. 李保利,陈玉忠,俞士汶. 计算机工程与应用. 2003(10)
本文编号:3551442
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图3.2卷积神经网络结构图??Figure?3.2?The?structure?diagram?of?convolutional?neural?network??
图4.7企业公告数据集上的实验结果??Figure?4.7?Experimental?results?on?the?Enterprise?announcement?dataset??
【参考文献】:
期刊论文
[1]基于Spark框架的高效KNN中文文本分类算法[J]. 于苹苹,倪建成,姚彬修,李淋淋,曹博. 计算机应用. 2016(12)
[2]信息抽取研究综述[J]. 李保利,陈玉忠,俞士汶. 计算机工程与应用. 2003(10)
本文编号:3551442
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3551442.html
最近更新
教材专著