基于语义的引用内容情感分析及其应用研究
发布时间:2021-11-09 14:02
引文分析是科技评价与管理领域的一个重要研究议题。引用内容分析相较于传统的只考察被引频次的引文分析方法而言可以有效发现引用内容中的语义关联、情感倾向等有重要价值的引用信息,从而更加全面的判断引文的引用价值。但引用内容的情感分析不同于传统文本(如微博文本)的情感分类,引用内容中表达的情感大多为隐含的,这使得引用内容情感(尤其是负面情感)自动识别的准确率较低。随着引用内容分析研究的深入,结合引用内容生成单篇论文的科学摘要也逐渐受到研究者们的关注,其可从被引文献的应用角度阐明被引文献在科学社区中的贡献。但是,当前的引文摘要研究没有考察施引者的施引情感,使得生成的引文摘要带有一定的片面性。本文对引用内容的情感分类问题及基于施引情感的引文摘要生成问题进行了研究。通过捕捉施引者用以表达施引情感的话语模式,以提升引用内容情感分类的性能。在引用内容情感分类的基础上生成考察施引情感的逐面引文摘要,从而更好地阐述被引文献在科学社区中的贡献和价值。具体研究内容如下:(1)基于话语模式的引用内容情感分类研究。从引用内容的上下文语境中提取反映引用内容语义和结构特性的特征,将具有逻辑关系的特征进行组合以提取引用片段...
【文章来源】:东北林业大学黑龙江省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图1-]技术路线图??法,引入基于话语模式的组合特征、否定范围特征以及条件随机场模型,以提高引用内??容情感分类的性能
前两个及后一个句子)。语料集对文本片段中的每个句子??和整个文本片段都进行了标注:根据是否有助于其所在的引用片段(citation?context)的??情感判断,每个句子都会被标记为“1”或“0”?;整个文本片段也会伴随出现两个标??签:①目的标签,1-Criticizing,?2-Comparison,3-Use,4-Substantiating,5-Basis?和?6-??Neutral;②极性标签:1-neutral,?2-positive和3-negative,部分数据集示例见图3-2:??1?ciTing_id?citied_id?year?sentciKes?vvith?labels?piupose_label?polaiity_label??2?P96-1041?A88-1019?1996?In?additic?0?Smoothir?1?A?languac?0?Language?0?6?1??3?A94-1022?C88-2121?1994?which?car?0?Conventi-?0?Handling?0?In?ourap?1?2?3??4?J95-1001?P89-1010?1995?Content?\?0?One?muc?0?Discrimin?0?Determin?1?5?2??5?COO-2148?J88-2003?2000?By?using?'?0?We?deco?1?hfitial?tree?0?For?exam?0?4?2??图3-2部分原始数据集示例??在该数据集标注规则的基础上,结合jun?Xu[35]提出的极性标注方案,本研究制定了??如下极性标注规则:①若引用内容中明确表达
sambiguati?0?<REF>As?ChfTlEstimates?fro?0?For?example.?0?12??7?J97-1005?J86-3001?1997?Site?before?af〇|NA?t?NA?f?jolunlike?the?cu5jCue-prosod/cr]〇?0??8?J97-1005?J86-3001?1997?We?concludei ̄0;21?CharacteriLDJThe?linauisticfolrhe?hierarchiijOl?0?0??图3-3文本片段选取及删除示例??b)由于原始数据集中的句子内容是棰于正则表达式获取的,不可避免的会获取到??+符合句法结构(比如句中无动词)或与原文不符的句子,本研究对这样的文本片段做??进一步的剔除,最终获得1260个带有极性标签的文本片段并将其用于活续的数据处理??和分类实验。??(2)参名文献标识预处理??在撰写学术论文时,作者经常会用一些特殊的格式来表示对参考文献的引用(比??如,通常会用小括号对参考文献进行表示),而这些内容并不是句子的成分,若不对其??进行处理,将会对下一步实验造成消极的影响。此预处理工作希望消除这些特殊的参考??文献标识对分类效果可能造成的不良影响。具体处理步骤描述如下:??Step?1:简化参考文献标识。<TREF>…<TREF>?—<TREF>;?<REF>...<REF>?—??<REF>;?(TREF:?H标参考文献;REF:其他参考文献)??Step?2:对j:?多个参考文献+小U丨连续出观的情况,统一给出两种标识:①若连续出??现的参考标i只中有<TREF>,则连续出现的参七标识统…替换为<GTR
【参考文献】:
期刊论文
[1]基于PCA与t-SNE特征降维的城市植被SVM识别方法[J]. 于慧伶,霍镜宇,张怡卓,蒋毅. 实验室研究与探索. 2019(12)
[2]基于引文内容分析的引用情感识别研究[J]. 廖君华,刘自强,白如江,陈军营. 图书情报工作. 2018(15)
[3]基于引用功能和引用极性的一个引用分类模型研究[J]. 尹莉,郭璐,李旭芬. 情报杂志. 2018(07)
[4]CitationAS: A Tool of Automatic Survey Generation Based on Citation Content[J]. Jie Wang,Chengzhi Zhang,Mengying Zhang,Sanhong Deng. Journal of Data and Information Science. 2018(02)
[5]基于引文上下文的学术文本自动摘要技术研究[J]. 陈海华,黄永,张炯,陆伟. 数字图书馆论坛. 2016(08)
[6]利用三层条件随机场模型进行情感极性分类及强度分析[J]. 李向前,李军伟. 计算机应用研究. 2017(04)
[7]基于朴素贝叶斯模型的自动引用分类研究[J]. 尹莉. 情报科学. 2015(02)
[8]引文内容分析方法研究综述[J]. 祝清松,冷伏海. 情报资料工作. 2013(05)
[9]引用语义化相关问题初探[J]. 齐燕. 情报理论与实践. 2013(08)
[10]大规模语料库上的Stanford和Berkeley句法分析器性能对比分析[J]. 项炜,金澎. 电脑知识与技术. 2013(08)
博士论文
[1]全文引文分析方法与应用[D]. 胡志刚.大连理工大学 2014
[2]科学论文的引用内容分析及其应用[D]. 刘盛博.大连理工大学 2014
硕士论文
[1]基于引文的英文文档文摘自动生成方法研究[D]. 任潇雨.西安电子科技大学 2014
[2]基于隐马尔科夫模型词性标注的研究[D]. 牛秀萍.太原理工大学 2013
[3]多标签聚类算法及其评价研究[D]. 程思颖.东北师范大学 2013
[4]基于向量空间模型的文本分类算法研究[D]. 张振峰.杭州电子科技大学 2011
[5]基于近邻传播和凝聚层次的文本聚类方法[D]. 何晏成.哈尔滨工业大学 2010
[6]基于扩展的VSM中文文本分类方法[D]. 井志强.哈尔滨工程大学 2010
本文编号:3485492
【文章来源】:东北林业大学黑龙江省 211工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图1-]技术路线图??法,引入基于话语模式的组合特征、否定范围特征以及条件随机场模型,以提高引用内??容情感分类的性能
前两个及后一个句子)。语料集对文本片段中的每个句子??和整个文本片段都进行了标注:根据是否有助于其所在的引用片段(citation?context)的??情感判断,每个句子都会被标记为“1”或“0”?;整个文本片段也会伴随出现两个标??签:①目的标签,1-Criticizing,?2-Comparison,3-Use,4-Substantiating,5-Basis?和?6-??Neutral;②极性标签:1-neutral,?2-positive和3-negative,部分数据集示例见图3-2:??1?ciTing_id?citied_id?year?sentciKes?vvith?labels?piupose_label?polaiity_label??2?P96-1041?A88-1019?1996?In?additic?0?Smoothir?1?A?languac?0?Language?0?6?1??3?A94-1022?C88-2121?1994?which?car?0?Conventi-?0?Handling?0?In?ourap?1?2?3??4?J95-1001?P89-1010?1995?Content?\?0?One?muc?0?Discrimin?0?Determin?1?5?2??5?COO-2148?J88-2003?2000?By?using?'?0?We?deco?1?hfitial?tree?0?For?exam?0?4?2??图3-2部分原始数据集示例??在该数据集标注规则的基础上,结合jun?Xu[35]提出的极性标注方案,本研究制定了??如下极性标注规则:①若引用内容中明确表达
sambiguati?0?<REF>As?ChfTlEstimates?fro?0?For?example.?0?12??7?J97-1005?J86-3001?1997?Site?before?af〇|NA?t?NA?f?jolunlike?the?cu5jCue-prosod/cr]〇?0??8?J97-1005?J86-3001?1997?We?concludei ̄0;21?CharacteriLDJThe?linauisticfolrhe?hierarchiijOl?0?0??图3-3文本片段选取及删除示例??b)由于原始数据集中的句子内容是棰于正则表达式获取的,不可避免的会获取到??+符合句法结构(比如句中无动词)或与原文不符的句子,本研究对这样的文本片段做??进一步的剔除,最终获得1260个带有极性标签的文本片段并将其用于活续的数据处理??和分类实验。??(2)参名文献标识预处理??在撰写学术论文时,作者经常会用一些特殊的格式来表示对参考文献的引用(比??如,通常会用小括号对参考文献进行表示),而这些内容并不是句子的成分,若不对其??进行处理,将会对下一步实验造成消极的影响。此预处理工作希望消除这些特殊的参考??文献标识对分类效果可能造成的不良影响。具体处理步骤描述如下:??Step?1:简化参考文献标识。<TREF>…<TREF>?—<TREF>;?<REF>...<REF>?—??<REF>;?(TREF:?H标参考文献;REF:其他参考文献)??Step?2:对j:?多个参考文献+小U丨连续出观的情况,统一给出两种标识:①若连续出??现的参考标i只中有<TREF>,则连续出现的参七标识统…替换为<GTR
【参考文献】:
期刊论文
[1]基于PCA与t-SNE特征降维的城市植被SVM识别方法[J]. 于慧伶,霍镜宇,张怡卓,蒋毅. 实验室研究与探索. 2019(12)
[2]基于引文内容分析的引用情感识别研究[J]. 廖君华,刘自强,白如江,陈军营. 图书情报工作. 2018(15)
[3]基于引用功能和引用极性的一个引用分类模型研究[J]. 尹莉,郭璐,李旭芬. 情报杂志. 2018(07)
[4]CitationAS: A Tool of Automatic Survey Generation Based on Citation Content[J]. Jie Wang,Chengzhi Zhang,Mengying Zhang,Sanhong Deng. Journal of Data and Information Science. 2018(02)
[5]基于引文上下文的学术文本自动摘要技术研究[J]. 陈海华,黄永,张炯,陆伟. 数字图书馆论坛. 2016(08)
[6]利用三层条件随机场模型进行情感极性分类及强度分析[J]. 李向前,李军伟. 计算机应用研究. 2017(04)
[7]基于朴素贝叶斯模型的自动引用分类研究[J]. 尹莉. 情报科学. 2015(02)
[8]引文内容分析方法研究综述[J]. 祝清松,冷伏海. 情报资料工作. 2013(05)
[9]引用语义化相关问题初探[J]. 齐燕. 情报理论与实践. 2013(08)
[10]大规模语料库上的Stanford和Berkeley句法分析器性能对比分析[J]. 项炜,金澎. 电脑知识与技术. 2013(08)
博士论文
[1]全文引文分析方法与应用[D]. 胡志刚.大连理工大学 2014
[2]科学论文的引用内容分析及其应用[D]. 刘盛博.大连理工大学 2014
硕士论文
[1]基于引文的英文文档文摘自动生成方法研究[D]. 任潇雨.西安电子科技大学 2014
[2]基于隐马尔科夫模型词性标注的研究[D]. 牛秀萍.太原理工大学 2013
[3]多标签聚类算法及其评价研究[D]. 程思颖.东北师范大学 2013
[4]基于向量空间模型的文本分类算法研究[D]. 张振峰.杭州电子科技大学 2011
[5]基于近邻传播和凝聚层次的文本聚类方法[D]. 何晏成.哈尔滨工业大学 2010
[6]基于扩展的VSM中文文本分类方法[D]. 井志强.哈尔滨工程大学 2010
本文编号:3485492
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3485492.html
最近更新
教材专著