当前位置:主页 > 科技论文 > 自动化论文 >

面向用户生成数据的深度语义表征技术与应用

发布时间:2020-11-21 21:07
   随着技术的进步与国家的大力推动,互联网逐步走向每一处角落和每一个人,各种网络服务也深入了人们生活的方方面面。网络用户已从单纯的信息消费者变成了生产者,并产生了大量的用户生成数据。而其中,实时评论与产品评论作为两种最具影响力的用户生成数据,倍受业界关注。实时评论也叫弹幕,引领了一种新兴的、允许用户针对在线视频发送实时评论的互动模式,这种模式大大提升了用户的活跃程度与用户体验,对于在线娱乐产业来说蕴含着诱人的发展前景。产品评论是用户在线购买产品后针对产品的评价,对其他消费者的购买决策有重大的可量化的影响,对于企业提升竞争力和实施市场营销一直发挥着不可替代的作用。很显然,无论是弹幕还是产品评论,用户生成数据的分析对于企业营销、提升竞争力等方面都具有很高的应用价值,然而它们所具有的非正式表达、主观性与多样性以及动态演化的领域专业性也给其应用带来了巨大挑战,即如何表示非正式表达的语义,如何建模多样化语义之间的关联,和如何持续性地对领域数据进行有效建模?而这些挑战的最根本问题就在于如何有效地进行语义表示,即将不规整的、难以直接处理的内容,通过表征技术转化为低维、连续空间中的语义向量,使其更加规整且易进行端到端建模。鉴于深度学习技术在语义表征方面的突破性成果,本文从语义层面出发,研究用户评论数据的深度语义表征技术,并以此为基础,分别从空间层面与时间层面切人,针对用户生成数据的“主观性、多样性”与“动态演化的领域专业性”带来的挑战,研究多表征空间的映射和终身表征学习技术。其具体内容及其对应的应用如下:首先,针对在线视频平台在视频管理中面临的现实问题,以及弹幕评论的非正式表达带来的挑战,提出了基于弹幕深度语义表征技术的在线视频时序标注方法。具体来讲,为了更好地理解弹幕语义,本文设计了基于深度神经网络的时序深度语义模型,利用弹幕“时序粘滞性”假设学习弹幕的语义向量,进而基于弹幕的语义向量构建视频片段的语义特征,最后使用有监督的方法对片段的高潮类型进行标注。通过在真实弹幕数据集上进行实验,证实了基于弹幕语义表征进行视频时序标注的有效性。其次,针对视频分享平台提升用户体验的实际需求,以及弹幕所拥有的针对视频内容“吐槽”的特性,研究了基于表征空间映射的视频实时评论生成方法。该方法分为多空间语义表征和表征空间映射两部分。对于多空间语义表征,一方面要求语义向量准确刻画图像以及文本的语义,另一方面又需要通过文本语义向量解码出具有多样化语义表达的弹幕,因此本文设计了针对图像和弹幕的变分自编码器,提出控制其表征能力与生成能力之间平衡的方法。在表征空间映射方面,为了体现出弹幕语义的多样性,本文进一步提出基于生成对抗网络的表征空间映射方法,从而最终实现多样化弹幕的生成。最后,在真实数据集上结合人工评测等多种指标,客观地评估模型效果。最后,针对用户商品评论所具有的领域专业性,及其领域动态演化带来的挑战,研究了基于终身表征学习的情感分类问题。在终身情感分类的应用场景中,模型会随着时间的推移连续执行一系列的分类任务,其目标是把从历史任务中获得的知识用于新任务,使其在新任务上的表现比不使用任何知识更好。现有的终身情感分类方法主要基于朴素贝叶斯,由于其基础模型的限制,其效果仍有一定提升空间,因此,本文提出了使用循环神经网络作为基础模型的终身情感分类方法,该方法强调短期知识与长期知识的融合。需要强调的是,针对神经网络类模型在增量学习的过程中出现的灾难性遗忘问题,本文基于神经元激活的稀疏性与知识积累的关系,设计了参数部分更新机制,缓解了灾难性遗忘。最后经真实数据集上的实验验证,证实了本文提出模型的有效性与稳定性。
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:TP391.1;TP181
【部分图文】:

网络应用,用户使用,时段,互联网


?第1章绪?论???第1章绪?论??1.1研究背景及意义??互联网是人类智慧的结晶、20世纪的重大科技发明、当代先进生产力的重??要标志[1]。随着互联网技术的高速发展,人类进入了连接一切的网络时代。在我??国政府推进互联网发展与普及、促进互联网广泛应用等方面的不懈努力下,网络??早已走进千家万户。中国互联网络信息中心(CNNIC)发布的第43次《中国互??联网络发展状况统计报告》(后简称《报告》)显示,2018年互联网覆盖范围进??一步扩大。随着贫困地区网络基础设施“最后一公里”逐步打通,流量资费大幅??下降,居民人网门槛进一步降低。截至2018年12月,我国网民规模达8.29亿,??普及率接近60%。在互联网逐步走向每一处角落和每一个人的同时,各种网络??服务更是深入了人们生活的方方面面,如图1.1所示,几乎每时每刻都有人在与??各类网络应用打交道。??

弹幕,时间位,跳转


但主题模型较难建模弹幕语言所具有的非正规表达。例如,“2333”用来??表示大笑,而“高能”表示高潮内容,这些表达都和正常语言不同,很难从字面??上理解。为此,本章提出了一种基于弹幕深度语义表征的视频理解框架,来更好??地借助弹幕信息刻画视频内容,并用以为视频的高潮片段标注时序标签。??特别地,针对弹幕中普遍存在的非正式表达,设计了一种将弹幕表征为语义??向量的时序深度语义模型(Temporal-Deep?Semantic?Structured?Model,T-DSSM),??该模型建立在弹幕视频中存在的“时序粘滞性”假设上,即:出现在相近时间段??内的弹幕都是用户根据当前视频情节发送的,因此假设它们之间具有更高的语??义相关性。立足于该假设,便可构建弹幕两两之间的语义关联,进而通过对比学??习(Contrast?Learning)算法对模型进行训练。在此基础上,本章进一步探索通过??弹幕语义理解视频内容,借助T-DSSM表征弹幕得到的语义向量描述视频片段??的语义,从而实现高潮片段的识别与内容的时序标注。本章>绍的工作,可以算??作是第一批探索通过使用弹幕以有监督的方式对视频进行标注。??最后,在来自bilibili平台的真实数据集上进行大量实验表明,结合T-DSSM??

数量分布,弹幕,文本长度,数据集中


数量分布??幕的相关统计内容有很多,其中包括在不同类别的视频中条长度随视频播放的分布变化。图2.2展示了不同的弹幕长播放时间的分布,从图中可以看出弹幕的长度主要集中在3个长度一般也是一个单句的字符长度。考虑到弹幕的形式以认为观众一般一次只会发一个单句,而且这些弹幕句子现象与传统的评论模式很不一样,可以看出短句子占了很持弹幕的视频的形式也密切相关,由于观众会在观看视频此短句子能够更好地表达用户在观看视频时的感受;此外,弹幕不是短句子,而是会超过40个字符的长句子,这种弹文字,在仔细检查完这类长弹幕之后发现,绝大多数的长句意义句子的最后一个字的形式出现,比如用户会在输入“23个“3”,以此来表达与“Id”相同含义的意思,从而能够更段视频十分有趣。??800000-p?■?'?'?■?—:??????
【相似文献】

相关期刊论文 前10条

1 赵秀;;弹幕电影的受众心理分析[J];新闻研究导刊;2019年10期

2 计春一;;网络时代下的影视弹幕传播简述[J];西部广播电视;2019年11期

3 李烁文;;2018年十大弹幕词语言特点分析[J];新余学院学报;2019年04期

4 张曜多;;弹幕视频的流行研究[J];传媒国际评论;2015年00期

5 熊晓庆;高尚;;经典影视剧的沦陷:弹幕狂欢下的审美嬗变及伦理反思[J];电影文学;2018年22期

6 高沛伦;;弹幕视频特性与受众互动行为探析[J];传播与版权;2018年11期

7 贺成;;别让弹幕把荧屏搞得乌烟瘴气[J];声屏世界;2018年11期

8 孙振虎;赵甜;;参与式文化视角下的弹幕视频分析[J];当代传播;2018年06期

9 刘莎莎;刘坤;;探析弹幕视频的发展优势及问题[J];传媒论坛;2018年22期

10 杨希;;大学生弹幕族亚文化现象检视[J];高校辅导员学刊;2019年01期


相关博士学位论文 前3条

1 吕广奕;面向用户生成数据的深度语义表征技术与应用[D];中国科学技术大学;2019年

2 段朝辉;活动理论视角下在线视频学习中不同学习风格者的交互活动模式及作用机制[D];华中师范大学;2018年

3 何明;面向在线视频弹幕数据的挖掘方法研究[D];中国科学技术大学;2018年


相关硕士学位论文 前10条

1 皇甫旭梅;狂欢理论视域下的弹幕视频研究[D];武汉大学;2017年

2 杨晨;网络视频平台的弹幕用语现状调查研究[D];沈阳师范大学;2019年

3 葛欣怡;弹幕在不同场景中的传播效果探究[D];北京邮电大学;2019年

4 梁晨;弹幕与评论对网络视频流行度的影响差异研究[D];北京邮电大学;2019年

5 宣一鸣;基于人物角色的视频弹幕多维度分析系统设计与实现[D];北京邮电大学;2019年

6 曾婧;面向“一起看”直播类型的直播助手设计与实现[D];南京大学;2019年

7 孙玮洁;弹幕视频中的互动仪式链模型研究及情感能量模型探究[D];厦门大学;2018年

8 管宪任;基于使用与满足理论的弹幕使用动机研究[D];武汉理工大学;2018年

9 朱钰涵;在线视频社区中弹幕信息交互群体的用户画像研究[D];南京大学;2019年

10 李茹欣;视频弹幕的语言学研究[D];陕西师范大学;2018年



本文编号:2893599

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2893599.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2fdf5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com