社交网络跨媒体国民安全事件语义学习与行为分析研究
发布时间:2020-06-08 07:07
【摘要】:社交网络日益流行并且大量用户持续活跃,社交网络积累了大量用户产生的数据。社交网络中除了文本之外,还包括图像等多种异构媒体数据。微博因为文字数量限制,在用简明扼要的文字说明之后,通常会借用一幅或者多幅图像来对事件进行描述。因此解决文本图像内容不严格对应问题,对异构模态数据进行分析与建模,实现语义一致性表达和异常检测是非常必要的。本文完成的主要工作如下:(1)采用深度学习理论与算法以实现社交网络图像与文本深度特征的提取与表达。提出了一种基于深度卷积神经网络的社交网络图像自编码算法(DCNNSE),提高了图像编码的有效性。在社交网络数据集上,图像自编码算法使图像搜索的准确度提升了 27.1%。提出了一种文本半监督嵌入自动编码算法(SEAC),在文本编码具有文本语义的同时也加入了时空信息,相比Word2vec在搜索上的平均精确度与准确率上都有提升。(2)提出了一种处理社交网络跨模态匹配问题的深度典型相关性分析融合回归神经网络(DMRN),通过在回归网络的输入之前执行图像和文本特征的非线性处理,再结合了深度典型相关性分析,在跨媒体搜索中图像搜索文本和文本搜索图像的召回率分别提升了12.6%和 11.8%。(3)提出了基于层次注意力加权的异常用户检测模型(LAWW),针对社交网络言论较短、判断异常用户较难的问题,通过采用注意力机制与统计学特征对输入加权,挖掘出了更有效的检测特征,提出的LAWW算法在异常用户检测准确率达到了 73.32%。(4)设计和开发了社交网络跨媒体国民安全事件语义学习与行为分析系统。提供深度神经网络模型参数设置功能。通过对输入数据进行学习,提取出社交网络跨媒体数据的深度特征。实现了跨媒体多模态的语义空间映射、跨媒体多模态的搜索、跨媒体多模态用户行为分析等功能。系统功能全面,并实现了友好的用户交互界面。本文实现了社交网络跨媒体深度特征提取,提出了社交网络跨媒体语义空间的映射与表示,针对社交网络异常用户进行了检测,开发了社交网络跨媒体国民安全事件语义学习与行为分析系统,并对系统进行了测试与验证。
【图文】:
逦64位逡逑□邋DA邋BAEVB邋□邋DCNNSE-1邋□邋DCNNSE-2逡逑图3-3不同算法在社交网络图像上的准确率指标柱状图逡逑从平均准确度量化指标上看,可以参见表3-3和图34所示的不同算法的客逡逑观评价指标值。逡逑由表3-3和图34可知,对于平均准确率,DCNNSE-2算法相比于其他三个逡逑算法指标值分别平均提升了邋11.9%、25.1%和24.7%。通过图3M可以得出与准确逡逑率指标相似的结论,DCNNSE-2对比DCNNSE-1算法依然在编码长度较低的时逡逑候提升较为明显,DA和DCNNSE-2在编码长度不同时较为稳定,AEVB和逡逑DCNNSE-1在不同编码长度指标会出现大幅度的波动。可以看到在算法准确率接逡逑近的情况下,DCNNSE-2具有更高的MAP值,说明本节提出的算法以事件为中逡逑心的编码方式增大了图像的区分度,对搜索结果靠前的图像的相关性有更大的置逡逑信度。逡逑逦表3-3不同算法在社交网络图像上的平均准确度指标对比逦逡逑MAP@5逦16邋位逦32邋位逦64邋位逡逑DA逦0.180逦0.202逦0.218逡逑AEVB逦0.200逦0.176逦0.162逡逑
10和20个搜索结果的准确率和平均准确率来评价本节的算法。逡逑将四种算法在社交网络文本上的实验结果对比如下:首先,关于准确率指标,逡逑本节可以参见表34和图3-7所示的不同算法的客观评价指标值。逡逑逦表3-4不同算法在社交网络文本上的搜索准确度指标对比逦逡逑Precision逦Top5逦ToplO逦Top20逡逑SEAC逦0.782逦0.767逦0.75逡逑Word2Vec逦0.76逦0.739逦0.7185逡逑LDA逦0.642逦0.607逦0.5795逡逑BOW逦0.672逦0.606逦0.596逡逑Precision逡逑0-8邋,逡逑=_逦■媝|逦g逦__逦_逡逑“NUNN逡逑;y逦W 邋ii逦■逦ii逦W 逡逑Top5逦ToplO逦Top20逡逑SEAC邋Word2Vec邋H邋LDA邋=巳OW逡逑图3-7不同算法在社交网络文本上的搜索准确率指标柱状图逡逑由表34和图3-7可知,不同算法在搜索队列长度增长时准确度都会下降,,逡逑但是SEAC和Wordlvec下降的幅度明显较小。在搜索结果靠前的队列结果中逡逑SEAC始终保持最高的准确率,不同的搜索队列长度上搜索准确度相比Word2Vec、逡逑LDA、BOW邋分别提升了邋3.8%、26.2%和邋22.9°/。。逡逑从平均准确度量化指标上看
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.41;TP181
本文编号:2702722
【图文】:
逦64位逡逑□邋DA邋BAEVB邋□邋DCNNSE-1邋□邋DCNNSE-2逡逑图3-3不同算法在社交网络图像上的准确率指标柱状图逡逑从平均准确度量化指标上看,可以参见表3-3和图34所示的不同算法的客逡逑观评价指标值。逡逑由表3-3和图34可知,对于平均准确率,DCNNSE-2算法相比于其他三个逡逑算法指标值分别平均提升了邋11.9%、25.1%和24.7%。通过图3M可以得出与准确逡逑率指标相似的结论,DCNNSE-2对比DCNNSE-1算法依然在编码长度较低的时逡逑候提升较为明显,DA和DCNNSE-2在编码长度不同时较为稳定,AEVB和逡逑DCNNSE-1在不同编码长度指标会出现大幅度的波动。可以看到在算法准确率接逡逑近的情况下,DCNNSE-2具有更高的MAP值,说明本节提出的算法以事件为中逡逑心的编码方式增大了图像的区分度,对搜索结果靠前的图像的相关性有更大的置逡逑信度。逡逑逦表3-3不同算法在社交网络图像上的平均准确度指标对比逦逡逑MAP@5逦16邋位逦32邋位逦64邋位逡逑DA逦0.180逦0.202逦0.218逡逑AEVB逦0.200逦0.176逦0.162逡逑
10和20个搜索结果的准确率和平均准确率来评价本节的算法。逡逑将四种算法在社交网络文本上的实验结果对比如下:首先,关于准确率指标,逡逑本节可以参见表34和图3-7所示的不同算法的客观评价指标值。逡逑逦表3-4不同算法在社交网络文本上的搜索准确度指标对比逦逡逑Precision逦Top5逦ToplO逦Top20逡逑SEAC逦0.782逦0.767逦0.75逡逑Word2Vec逦0.76逦0.739逦0.7185逡逑LDA逦0.642逦0.607逦0.5795逡逑BOW逦0.672逦0.606逦0.596逡逑Precision逡逑0-8邋,逡逑=_逦■媝|逦g逦__逦_逡逑“NUNN逡逑;y逦W 邋ii逦■逦ii逦W 逡逑Top5逦ToplO逦Top20逡逑SEAC邋Word2Vec邋H邋LDA邋=巳OW逡逑图3-7不同算法在社交网络文本上的搜索准确率指标柱状图逡逑由表34和图3-7可知,不同算法在搜索队列长度增长时准确度都会下降,,逡逑但是SEAC和Wordlvec下降的幅度明显较小。在搜索结果靠前的队列结果中逡逑SEAC始终保持最高的准确率,不同的搜索队列长度上搜索准确度相比Word2Vec、逡逑LDA、BOW邋分别提升了邋3.8%、26.2%和邋22.9°/。。逡逑从平均准确度量化指标上看
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.41;TP181
【参考文献】
相关期刊论文 前3条
1 吴禀雅;魏苗;;从深度学习回顾自然语言处理词嵌入方法[J];电脑知识与技术;2016年36期
2 谢锦;蔡自兴;;一种基于Local Jet 结构的全局图像特征构造方法(英文)[J];自动化学报;2014年06期
3 陆悠;李伟;罗军舟;蒋健;夏怒;;一种基于选择性协同学习的网络用户异常行为检测方法[J];计算机学报;2014年01期
相关博士学位论文 前2条
1 冯方向;基于深度学习的跨模态检索研究[D];北京邮电大学;2015年
2 王智愚;社会化多媒体内容分析与摘要[D];清华大学;2013年
相关硕士学位论文 前2条
1 臧虎;基于深层网络的多模态特征融合问题的研究与应用[D];北京邮电大学;2015年
2 薛晓冬;网络行为特征模型及在个性化服务中的应用[D];华南理工大学;2013年
本文编号:2702722
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2702722.html