多源学术新媒体用户生成内容的知识聚合研究
发布时间:2021-08-03 10:13
随着信息经济迅猛发展,学术新媒体作为新型的网络学术知识平台逐渐受到科研工作者的关注,为知识信息获取、知识交流、知识传播等带来了改变。学术新媒体以学术微博、学术微信公众号、学术虚拟社区、学术APP等主要形式存在,具有平台类型多样、平台内容丰富、平台知识专业化等特点。为科研工作者提供了获取学术信息、分享学术成果、开展学术交流等活动的新途径。学术新媒体不再以文章、期刊论文等长文本形式作为知识推送的内容,学术用户作为学术新媒体环境中知识接受者与生产者两种身份并存,新媒体环境鼓励学术用户通过提问、回答与分享来自主产生新知识,创新了学术知识获取方式。随着新媒体环境的扩张,互联网中的用户生成内容呈现出了爆炸式增长,用户在搜寻知识过程中需要消耗大量的时间和精力去浏览与筛选知识内容。知识内容出现“知识过载”,用户陷入“知识迷航”,而学术新媒体中的用户生成知识内容也存在内容质量参差不齐,知识点碎片化分散,内容冗余等问题。同时不同学术新媒体平台间缺乏信息交流,单一平台内的知识无法及时完善与更新,导致用户须花费大量时间去浏览多平台内的知识,增加了获取知识的难度。如何对学术新媒体内用户生成内容进行知识的挖掘、组...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:193 页
【学位级别】:博士
【部分图文】:
标准RNN前向传播流程
吉林大学博士学位论文78和梯度爆炸等问题。为更好地处理信息长期依赖的问题,HochreiterS等人建立了长短期记忆(LongShortTermMemory,LSTM)模型[1]。其独特的细胞状态更新过程,让当前信息传递具有长时记忆性,让多个时刻的信息相互影响,从而缓解梯度消失等问题。LSTM模型使用“三门”设计,让输入的信息以细胞状态进行更新,进而对当前的输出和下一时刻的更新产生影响。具体的步骤如图4.4所示。图4.4LSTM模型结构图图中的“三门”分别为:遗忘门、输入门、输出门。通过遗忘门,计算ft概率,用以决定继承上一时刻隐藏层信息的比重。具体表达式如下所示。其中xt为输入变量,ht-1为上一时刻的输出,Wf为权重系数,bf为偏置常量,σ为sigmoid函数,取值介于0到1之间。()1,tfttffWhxb=+………..………………(公式4.3)通过输入门,结合遗忘门的概率ft,计算细胞Ct的变化。具体分为两步:第一步计算σ层的概率it,决定候选细胞tCD¤的更新程度,再利用tanh函数创建一个新的候选细胞tCD¤。第二步结合遗忘门概率ft,前一时刻的细胞状态Ct-1以及it和tCD¤获取本层细胞状态信息Ct。其详细的计算公式如下所示。其中Wi、Wc为相应的权重系数,bi,bc为相应的偏置常量。()1,tittiiWhxb=+……….………………(公式4.4)()1tanh,tcttcCWhxb=+……….………………(公式4.5)[1]HochreiterS,Schmidhuber,Jürgen.LongShort-TermMemory[J].NeuralComputation,1997,9(8):1735-1780.
第4章多源学术新媒体用户生成内容的质量评测79ttt1ttCfCiC=+……….………………(公式4.6)通过输出门,计算输出ht。首先利用σ层计算一个输出概率ot,再结合当前时刻的细胞状态Ct获得最终的输出信息,具体公式如下所示。其中Wo为权重系数,bo为偏置常量。()1,tottooWhxb=+……….………………(公式4.7)tanh()ttth=oC……….………………(公式4.8)(3)门控循环单元GRU门控循环单元(GatedRecurrentUnit,GRU)是由ChoK于2014年提出的一种LSTM神经网络的变体[1]。它简化了LSTM模型的“三门”结构,去除了细胞状态的更新,采用重置门与更新门的双门结构,可以有效防止LSTM过拟合的问题,同时提升神经网络的学习效率,其具体学习流程如图4.5所示。图4.5重置门与更新门结构GRU网络的学习具体步骤为:通过更新门决定哪些信息将被传递到当前的隐层状态ht中,用以更新下一代的隐层信息。其中zt为更新概率,Wz为权重矩阵,ht-1为上一时刻的隐层状态,xt为当前时刻的输入。()1,tzttzWhx=……….………………(公式4.9)通过重置门决定上一时刻的隐层信息中有多少需要被遗忘,用以更新当前记忆内容。其中Wr为权重系数,rt为重置门输出概率。[1]ChoK,VanMerrienboerB,GulcehreC,etal.LearningPhraseRepresentationsusingRNNEncoder-DecoderforStatisticalMachineTranslation[J].ComputerScience,2014.
【参考文献】:
期刊论文
[1]汉语句法分析中的论元关系模型研究[J]. 刘作国,陈笑蓉. 南京大学学报(自然科学). 2019(06)
[2]基于短语级情感分析的不良信息检测方法[J]. 明弋洋,刘晓洁. 四川大学学报(自然科学版). 2019(06)
[3]利用语义信息的句法分析统计模型[J]. 袁里驰. 小型微型计算机系统. 2019(10)
[4]摄影领域评论情感词典构建方法[J]. 刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻. 计算机工程与设计. 2019(10)
[5]基于类别特征扩展的短文本分类方法研究[J]. 邵云飞,刘东苏. 数据分析与知识发现. 2019(09)
[6]新媒体背景下如何提升学术期刊的品牌影响力[J]. 萨日娜. 传播力研究. 2019(27)
[7]基于模糊机制和语义密度聚类的汉语自动语义角色标注研究[J]. 王旭阳,朱鹏飞. 计算机应用与软件. 2019(09)
[8]新媒体语境下科技期刊传播效果影响因素分析[J]. 甄伟锋. 中国科技期刊研究. 2019(08)
[9]大众性问答社区答案质量排序方法研究[J]. 易明,张婷婷. 数据分析与知识发现. 2019(06)
[10]基于用户画像的UGC质量预判模型[J]. 金燕,孙佳佳. 情报理论与实践. 2019(10)
博士论文
[1]社会化电子商务用户信息采纳过程及影响因素研究[D]. 耿荣娜.吉林大学 2017
[2]社会媒体信息推荐关键技术研究[D]. 李洋.哈尔滨工业大学 2017
[3]学术新媒体信息服务模式与服务质量评价研究[D]. 李宇佳.吉林大学 2017
[4]基于关联数据的数字图书馆资源聚合与服务研究[D]. 伍革新.华中师范大学 2013
[5]面向网络社区问答对的语义挖掘研究[D]. 王宝勋.哈尔滨工业大学 2013
[6]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
[7]个性化推荐技术中的协同过滤算法研究[D]. 夏培勇.中国海洋大学 2011
[8]基于网络方法的专家知识推荐[D]. 许云红.中国科学技术大学 2010
硕士论文
[1]基于神经网络的微博观点检测方法研究[D]. 韩玉鑫.新疆大学 2019
[2]基于语义信息的名词短语指代消歧研究[D]. 张江.新疆大学 2019
[3]社交电商平台用户行为研究[D]. 樊雨青.山东师范大学 2019
[4]基于词嵌入的个性化新闻推荐算法研究[D]. 李鲁君.上海师范大学 2019
[5]基于文本主题的社会化问答平台知识网络研究[D]. 陈晓威.南京大学 2019
[6]基于双语主题词嵌入模型的中朝跨语言文本分类方法的研究[D]. 田明杰.延边大学 2019
[7]维吾尔语名词短语指代消歧研究[D]. 陶豆豆.新疆大学 2018
[8]基于关联数据的汉语专利信息资源聚合研究[D]. 马晓晖.河北大学 2017
[9]虚拟社区用户持续知识共享行为研究[D]. 张晓亮.浙江工商大学 2015
[10]问答社区用户知识分享行为的动机研究[D]. 张体慧.中国矿业大学 2014
本文编号:3319439
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:193 页
【学位级别】:博士
【部分图文】:
标准RNN前向传播流程
吉林大学博士学位论文78和梯度爆炸等问题。为更好地处理信息长期依赖的问题,HochreiterS等人建立了长短期记忆(LongShortTermMemory,LSTM)模型[1]。其独特的细胞状态更新过程,让当前信息传递具有长时记忆性,让多个时刻的信息相互影响,从而缓解梯度消失等问题。LSTM模型使用“三门”设计,让输入的信息以细胞状态进行更新,进而对当前的输出和下一时刻的更新产生影响。具体的步骤如图4.4所示。图4.4LSTM模型结构图图中的“三门”分别为:遗忘门、输入门、输出门。通过遗忘门,计算ft概率,用以决定继承上一时刻隐藏层信息的比重。具体表达式如下所示。其中xt为输入变量,ht-1为上一时刻的输出,Wf为权重系数,bf为偏置常量,σ为sigmoid函数,取值介于0到1之间。()1,tfttffWhxb=+………..………………(公式4.3)通过输入门,结合遗忘门的概率ft,计算细胞Ct的变化。具体分为两步:第一步计算σ层的概率it,决定候选细胞tCD¤的更新程度,再利用tanh函数创建一个新的候选细胞tCD¤。第二步结合遗忘门概率ft,前一时刻的细胞状态Ct-1以及it和tCD¤获取本层细胞状态信息Ct。其详细的计算公式如下所示。其中Wi、Wc为相应的权重系数,bi,bc为相应的偏置常量。()1,tittiiWhxb=+……….………………(公式4.4)()1tanh,tcttcCWhxb=+……….………………(公式4.5)[1]HochreiterS,Schmidhuber,Jürgen.LongShort-TermMemory[J].NeuralComputation,1997,9(8):1735-1780.
第4章多源学术新媒体用户生成内容的质量评测79ttt1ttCfCiC=+……….………………(公式4.6)通过输出门,计算输出ht。首先利用σ层计算一个输出概率ot,再结合当前时刻的细胞状态Ct获得最终的输出信息,具体公式如下所示。其中Wo为权重系数,bo为偏置常量。()1,tottooWhxb=+……….………………(公式4.7)tanh()ttth=oC……….………………(公式4.8)(3)门控循环单元GRU门控循环单元(GatedRecurrentUnit,GRU)是由ChoK于2014年提出的一种LSTM神经网络的变体[1]。它简化了LSTM模型的“三门”结构,去除了细胞状态的更新,采用重置门与更新门的双门结构,可以有效防止LSTM过拟合的问题,同时提升神经网络的学习效率,其具体学习流程如图4.5所示。图4.5重置门与更新门结构GRU网络的学习具体步骤为:通过更新门决定哪些信息将被传递到当前的隐层状态ht中,用以更新下一代的隐层信息。其中zt为更新概率,Wz为权重矩阵,ht-1为上一时刻的隐层状态,xt为当前时刻的输入。()1,tzttzWhx=……….………………(公式4.9)通过重置门决定上一时刻的隐层信息中有多少需要被遗忘,用以更新当前记忆内容。其中Wr为权重系数,rt为重置门输出概率。[1]ChoK,VanMerrienboerB,GulcehreC,etal.LearningPhraseRepresentationsusingRNNEncoder-DecoderforStatisticalMachineTranslation[J].ComputerScience,2014.
【参考文献】:
期刊论文
[1]汉语句法分析中的论元关系模型研究[J]. 刘作国,陈笑蓉. 南京大学学报(自然科学). 2019(06)
[2]基于短语级情感分析的不良信息检测方法[J]. 明弋洋,刘晓洁. 四川大学学报(自然科学版). 2019(06)
[3]利用语义信息的句法分析统计模型[J]. 袁里驰. 小型微型计算机系统. 2019(10)
[4]摄影领域评论情感词典构建方法[J]. 刘亚桥,陆向艳,邓凯凯,阮开栋,刘峻. 计算机工程与设计. 2019(10)
[5]基于类别特征扩展的短文本分类方法研究[J]. 邵云飞,刘东苏. 数据分析与知识发现. 2019(09)
[6]新媒体背景下如何提升学术期刊的品牌影响力[J]. 萨日娜. 传播力研究. 2019(27)
[7]基于模糊机制和语义密度聚类的汉语自动语义角色标注研究[J]. 王旭阳,朱鹏飞. 计算机应用与软件. 2019(09)
[8]新媒体语境下科技期刊传播效果影响因素分析[J]. 甄伟锋. 中国科技期刊研究. 2019(08)
[9]大众性问答社区答案质量排序方法研究[J]. 易明,张婷婷. 数据分析与知识发现. 2019(06)
[10]基于用户画像的UGC质量预判模型[J]. 金燕,孙佳佳. 情报理论与实践. 2019(10)
博士论文
[1]社会化电子商务用户信息采纳过程及影响因素研究[D]. 耿荣娜.吉林大学 2017
[2]社会媒体信息推荐关键技术研究[D]. 李洋.哈尔滨工业大学 2017
[3]学术新媒体信息服务模式与服务质量评价研究[D]. 李宇佳.吉林大学 2017
[4]基于关联数据的数字图书馆资源聚合与服务研究[D]. 伍革新.华中师范大学 2013
[5]面向网络社区问答对的语义挖掘研究[D]. 王宝勋.哈尔滨工业大学 2013
[6]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
[7]个性化推荐技术中的协同过滤算法研究[D]. 夏培勇.中国海洋大学 2011
[8]基于网络方法的专家知识推荐[D]. 许云红.中国科学技术大学 2010
硕士论文
[1]基于神经网络的微博观点检测方法研究[D]. 韩玉鑫.新疆大学 2019
[2]基于语义信息的名词短语指代消歧研究[D]. 张江.新疆大学 2019
[3]社交电商平台用户行为研究[D]. 樊雨青.山东师范大学 2019
[4]基于词嵌入的个性化新闻推荐算法研究[D]. 李鲁君.上海师范大学 2019
[5]基于文本主题的社会化问答平台知识网络研究[D]. 陈晓威.南京大学 2019
[6]基于双语主题词嵌入模型的中朝跨语言文本分类方法的研究[D]. 田明杰.延边大学 2019
[7]维吾尔语名词短语指代消歧研究[D]. 陶豆豆.新疆大学 2018
[8]基于关联数据的汉语专利信息资源聚合研究[D]. 马晓晖.河北大学 2017
[9]虚拟社区用户持续知识共享行为研究[D]. 张晓亮.浙江工商大学 2015
[10]问答社区用户知识分享行为的动机研究[D]. 张体慧.中国矿业大学 2014
本文编号:3319439
本文链接:https://www.wllwen.com/guanlilunwen/shequguanli/3319439.html