社交网络跨媒体国民安全语义学习与微博话题搜索的研究
发布时间:2020-07-01 11:05
【摘要】:随着社交网络的普及,越来越多的用户通过社交平台传递信息,使得大量数据在社交网络上快速、广泛传播。社交网络中数据的存在形式不单是文本,还存在着图像、视频等多种类型。因此提取跨媒体数据中的语义信息,完成数据在统一语义空间中的特征表达具有重大意义。同时,用户在社交平台上的信息搜索需求日益增加。对于微博等平台上文本字数的限制问题,研究查询扩展的方法来满足用户搜索需求成为热点。本文完成的主要工作如下:(1)通过对原始AlexNet 网络结构进行改进,提出了一个针对社交网络数据特征提取的新型AlexNet-Social神经网络模型。AlexNet-Social神经网络模型可以更为有效地提取社交网络数据的深度语义信息,并减少模型参数计算量。在社交网络图像数据集上进行实验,AlexNet-Social神经网络模型的分类准确度指标比改进前的模型提升约5.6%,AlexNet-Social模型的训练效率比改进前的模型提升约36%。(2)提出了一个针对社交网络国民安全类事件的跨媒体语义模型CSMBA(Cross-modal Semantic Model Based on AlexNet-Social),模型采用深度神经网络分别提取文本与图像数据的特征,并采用注意力机制完成了两种语义特征的统一表达。在社交网络文本与图像数据集上,CSMBA模型对相关事件识别任务的精确率、召回值、F值评价指标相比对比模型均有较大提升。(3)提出了一个结合社交特性与时间因素的微博搜索算法WSAST(Weibo Searching Algorithm Combining Social and Time Factors)。在查询词拓展方面,提出了结合语义相似度与时间相似度进行查询词扩展的方法,不但利用了微博文本中的语义信息,而且考虑词语的时间分布状况。在搜索结果重排方面,采用结合文本词频与微博热度的重排,充分利用微博用户参与的社交特性来优化搜索结果。实验表明WSAST算法在搜索准确率指标上相比其他对比算法有最好的表现。WSAST算法有效地提高了微博搜索的表现,较好地满足用户的搜索需求。(4)设计实现了微博国民安全事件识别与话题搜索系统。通过需求分析确定系统的五个功能模块:数据预处理功能模块、国民安全事件数据库建立模块、国民安全事件类别扩展模块、微博话题搜索模块与系统可视化模块。对系统功能进行了测试,测试结果表明系统可以满足识别微博中国民安全事件以及优化用户搜索的需求。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP183
【图文】:
卷积操作之后,可以用来降低卷积操作后数据的维度,并完成图像特征的融合。逡逑池化操作主要包括最大池化、平均池化和重叠池化等。在AlexNet中池化操作使逡逑用的是最大池化操作。池化操作原理图如图2-1所示。逡逑输入数据逡逑^逦逡逑19?^逡逑__:_____I___逦使川〕2邋大'J、的迪邋r—j—,逡逑3逦4逦8逦1逦化窗||处#邋4逦8逡逑3逦3逦4逦7逦3逦9逡逑12逦9逦6逡逑逦^逡逑图2-1池化操作原理图逡逑卷积神经网络中的全连接层的主要作用是将图像的二维特征转化成一维的逡逑特征向量。通过使用与输入数据的尺寸大小一致的卷积核进行卷积操作来完成特逡逑征向量的生成。以AlexNet第六层全连接层为例,输入数据大小为(6,邋6,邋256),逡逑使用相同尺寸大小的滤波器完成卷积操作,最终的结果使用一个神经元输出,滤逡逑波器数目为4096,生成向量的大小同样为4096。逡逑2.2跨媒体分析相关技术逡逑在计算机领域媒体的含义可以大致分为两种。第一种是指媒介,即数据存储逡逑的实体比如:硬盘、光盘、半导体存储材质等。第二种则是指信息的载体,数据逡逑以何种形式传播分析,较为常见的载体有文字数据、图像数据、语音数
重复以一定概率选择一个词的操作,最后就生成了一篇文档。而LDA逡逑模型的形成过程是文档生成的逆过程,即首先得到一篇文档,然后去获取文档的逡逑主题,最后确定主题中有哪些词。LDA模型跨模态数据分析图如图2-2所不。逡逑I逦逦!邋|逦嗣涵-系D逦;逡逑!逦'逦;逦!邋isii逦!逡逑语义关系丨丨呦..逦最大化:丨逡逑!逦:逦雕入;▲丨.n牛у危赍义希海掊宀凡垮澹欤颍核荆计义希卞宥喝憾殄澹海浚浚垮危校ㄍ计咤澹殄义希慑鍑缅澹翦錝肧肧谩跺澹垮澹澹啃踲|邋I邋卜I邋I逦>邋…逡逑.逦词嵌入逦;*逦人———丨邋i逦j逡逑^逦f邋*邋?邋?邋f逦f邋f邋.邋.邋.邋f逦^逡逑语料库词汇邋|邋|逦深度视觉模指逦|邋!逦涵涵
本文编号:2736675
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP183
【图文】:
卷积操作之后,可以用来降低卷积操作后数据的维度,并完成图像特征的融合。逡逑池化操作主要包括最大池化、平均池化和重叠池化等。在AlexNet中池化操作使逡逑用的是最大池化操作。池化操作原理图如图2-1所示。逡逑输入数据逡逑^逦逡逑19?^逡逑__:_____I___逦使川〕2邋大'J、的迪邋r—j—,逡逑3逦4逦8逦1逦化窗||处#邋4逦8逡逑3逦3逦4逦7逦3逦9逡逑12逦9逦6逡逑逦^逡逑图2-1池化操作原理图逡逑卷积神经网络中的全连接层的主要作用是将图像的二维特征转化成一维的逡逑特征向量。通过使用与输入数据的尺寸大小一致的卷积核进行卷积操作来完成特逡逑征向量的生成。以AlexNet第六层全连接层为例,输入数据大小为(6,邋6,邋256),逡逑使用相同尺寸大小的滤波器完成卷积操作,最终的结果使用一个神经元输出,滤逡逑波器数目为4096,生成向量的大小同样为4096。逡逑2.2跨媒体分析相关技术逡逑在计算机领域媒体的含义可以大致分为两种。第一种是指媒介,即数据存储逡逑的实体比如:硬盘、光盘、半导体存储材质等。第二种则是指信息的载体,数据逡逑以何种形式传播分析,较为常见的载体有文字数据、图像数据、语音数
重复以一定概率选择一个词的操作,最后就生成了一篇文档。而LDA逡逑模型的形成过程是文档生成的逆过程,即首先得到一篇文档,然后去获取文档的逡逑主题,最后确定主题中有哪些词。LDA模型跨模态数据分析图如图2-2所不。逡逑I逦逦!邋|逦嗣涵-系D逦;逡逑!逦'逦;逦!邋isii逦!逡逑语义关系丨丨呦..逦最大化:丨逡逑!逦:逦雕入;▲丨.n牛у危赍义希海掊宀凡垮澹欤颍核荆计义希卞宥喝憾殄澹海浚浚垮危校ㄍ计咤澹殄义希慑鍑缅澹翦錝肧肧谩跺澹垮澹澹啃踲|邋I邋卜I邋I逦>邋…逡逑.逦词嵌入逦;*逦人———丨邋i逦j逡逑^逦f邋*邋?邋?邋f逦f邋f邋.邋.邋.邋f逦^逡逑语料库词汇邋|邋|逦深度视觉模指逦|邋!逦涵涵
本文编号:2736675
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2736675.html