基于视觉信息的质量感知模型及检索方法研究

发布时间:2018-07-18 07:46
【摘要】:随着互联网及计算机视觉的迅猛发展,视觉信息大数据时代也接踵而至。如何从与视觉信息相关的海量的数据中迅速而准确地找到所需信息已成为一个非常有意义且具有挑战性的研究热点,其中又以视觉信息的质量为核心问题。视觉信息的质量直接影响信息的可展示性、检索的准确性与知识发现的可能性,进而影响人工智能推理的可靠性。另外,社交网络上图像、视频等可视化数据的数据量与日俱增,也预示着对多媒体数据有效的检索技术变得越来越重要。因此,本文重点研究视觉信息的统计特性,质量评价准则的设计及基于视觉信息的检索。主要的工作和创新点包括以下几个方面:(1)针对现有基于机器学习的无参考视频质量评价方法中需要利用大量主观评价分值进行训练,导致复杂度高的问题,提出一种非主观值训练的盲视频质量评价算法。该算法的关键是利用高斯差分滤波器提取视频结构特征矢量,并建立多级质量感知中心集合,构建视频空域质量评估密码本;然后利用聚类算法获取对运动矢量进行分类的阈值,进而得到运动感知因子;最后,结合视频空域感知质量和运动加权因子得到视频客观质量。结果表明,该算法优于对比的其他无参视频质量评价算法,且计算复杂度低。(2)综合考虑了影响立体视频用户体验质量QoE的关键因素,提出了一种面向网络传输业务的立体视频用户体验质量的多指标评价模型,该模型首先分析了立体视频QoE的四大类影响因素;然后利用模糊层次分析法对所有影响因素进行层次分析,建立评估指标体系;最后,计算各指标的权重值,得到最终的立体视频QoE评价模型。通过网络仿真实验,并利用主观评测值,验证各个指标对网络传输中立体视频QoE的影响。(3)针对社交媒体中图像和文本之间存在的噪声大及不完全对应,造成基于关键词查找图像的检索方法不准确问题,提出一种基于超图相关性学习的社交图像检索模型。该模型基于超图原理利用图像的视觉信息特征,文本信息,及用户的社交关系信息建立图像之间多类型的关系。在超图的学习过程中,利用选择性优化算法对超边的权重进行更新,实时的调整每个超边在超图重构中的影响。另外,将图像的受欢迎程度用于图像检索的重排序中。该方法适用于在社交媒体互动平台(比如Sina微博),利用图像视觉特征、辅助的文本信息及图像所属用户个人资料和兴趣之间的关系,检索出符合用户个性化要求的结果。
[Abstract]:With the rapid development of Internet and computer vision, the era of visual information big data is also coming. How to find the needed information quickly and accurately from the massive data related to visual information has become a very meaningful and challenging research hotspot, in which the quality of visual information is the core issue. The quality of visual information directly affects the display of information, the accuracy of retrieval and the possibility of knowledge discovery, and then affects the reliability of artificial intelligence reasoning. In addition, the increasing amount of visual data such as images and videos on social networks indicates that effective retrieval techniques for multimedia data are becoming more and more important. Therefore, this paper focuses on the statistical characteristics of visual information, the design of quality evaluation criteria and visual information based retrieval. The main work and innovations include the following aspects: (1) in order to solve the problem of high complexity, we need to use a large number of subjective evaluation scores to train the existing machine learning-based video quality evaluation methods without reference. A blind video quality evaluation algorithm based on non-subjective training is proposed. The key of this algorithm is to extract the feature vector of video structure by using Gao Si differential filter, and to build a set of multi-level quality perception centers and a codebook of video quality evaluation in spatial domain. Then the threshold of motion vector classification is obtained by clustering algorithm, and then the motion perception factor is obtained. Finally, video objective quality is obtained by combining video spatial perception quality and motion weighting factor. The results show that the proposed algorithm is superior to other non-parametric video quality evaluation algorithms, and the computational complexity is low. (2) the key factors affecting the quality of stereoscopic video users' experience quality are considered synthetically. In this paper, a multi-index evaluation model for the user experience quality of stereoscopic video for network transmission service is proposed. Firstly, four kinds of factors affecting the QoS of stereoscopic video are analyzed. Then the fuzzy analytic hierarchy process (FAHP) is used to analyze all the influencing factors, and the evaluation index system is established. Finally, the weight value of each index is calculated, and the final evaluation model of stereoscopic video QoS is obtained. Through the network simulation experiment and the subjective evaluation value, the influence of each index on the QoS of stereo video in the network transmission is verified. (3) aiming at the large noise and incomplete correspondence between images and texts in social media, This paper presents a social image retrieval model based on hypergraph relevance learning. Based on the hypergraph principle, the model uses visual information features, text information and social relationship information of users to establish multi-type relationships between images. In the learning process of hypergraph, the weight of hyper-edge is updated by selective optimization algorithm, and the influence of each hyper-edge in hypergraph reconstruction is adjusted in real time. In addition, the popularity of the image is used in the reordering of image retrieval. This method can be used in social media interactive platform (such as Weibo) to retrieve the results that meet the user's personalized requirements by using the visual features of images, the auxiliary text information and the relationship between the user's personal data and their interests.
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 张艳滨;余雁;;视觉信息的多维性探究[J];大众文艺;2013年04期

2 张恒;刘艳丽;;基于视觉信息融合的驾驶员疲劳监测方法综述[J];信息技术;2008年06期

3 李刚;;视觉信息传递的模糊性[J];美术大观;2010年03期

4 寿天德;尹德辉;;关于图形、图像与脑对视觉信息的处理[J];临沂师范学院学报;2010年01期

5 ;非电话类服务[J];视听界;1991年03期

6 韩丛耀;;中华艺术视觉信息数据库建设构想(上)——视觉信息处理机制的建模及在视觉信息数据库建设中的应用[J];中国教育信息化;2009年17期

7 王苗辉;;基于视知觉的视觉信息界面设计研究[J];包装工程;2011年08期

8 汪云九,邢静;视觉信息加工的一些理论和模型[J];机器人;1987年03期

9 刁云程;“视觉信息加工”研究圆满结束[J];中国科学基金;1994年01期

10 陈果;张武昕;高隽;;微小目标的视觉信息获取及系统设计[J];合肥工业大学学报(自然科学版);2007年12期

相关会议论文 前10条

1 何芸;杜诚;;21世纪的视觉信息技术[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

2 翁强;闫丽;翁伟生;;多维空间感知觉模型对视觉信息加工缺损的研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年

3 刘力;龚海韵;;果蝇蘑菇体对视觉信息的归纳作用[A];首届中国神经信息学讨论会摘要[C];2000年

4 孙明;;视觉信息学的基本概念及其新技术在农业中的应用[A];中国农业工程学会2011年学术年会论文集[C];2011年

5 王书荣;;视觉信息加工中的神经元相互作用[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

6 苏润娥;吉国明;宋笔锋;;人的视觉信息捕捉能力测试软件[A];陕西省航空装备制造技术发展——第九届陕西省青年科学家论坛论文集[C];2006年

7 杨瑾;李潇;王书荣;;家鸽背外侧丘脑神经元参与外侧单眼视觉和环境亮度检测[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

8 张春宇;张蔚;刘海鹏;于立平;王小捷;李睿凡;;基于视觉信息的汉语词汇语义习得[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

9 唐克伦;张湘伟;成思源;熊汉伟;张洪;;视觉信息与CMM测量数据的融合[A];第十二届全国图象图形学学术会议论文集[C];2005年

10 李珊珊;于庆宝;冯士刚;鹿麒麟;唐一源;;视觉信息等级处理的双脑协同性研究[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

相关重要报纸文章 前2条

1 记者 班威;“家务机器人”能走能做家务[N];新华每日电讯;2010年

2 本报驻北京记者 李雪;北京心目影院 盲人的音画世界[N];中国文化报;2014年

相关博士学位论文 前8条

1 卫津津;基于视觉信息的质量感知模型及检索方法研究[D];天津大学;2015年

2 查正军;基于机器学习方法的视觉信息标注研究[D];中国科学技术大学;2009年

3 祝博荟;基于深度与视觉信息融合的行人检测与再识别研究[D];东华大学;2013年

4 何立火;视觉信息质量感知模型及评价方法研究[D];西安电子科技大学;2013年

5 尹显东;多维随机序列敏感视觉信息隐藏技术研究[D];电子科技大学;2007年

6 沈乔楠;堆石混凝土施工管理中视觉信息的处理方法及应用研究[D];清华大学;2010年

7 王蒙军;唇读发声器中视觉信息的检测与处理[D];天津大学;2007年

8 刘震;基于局部视觉信息的大规模图像检索研究[D];中国科学技术大学;2015年

相关硕士学位论文 前10条

1 王苗苗;联合锋电位和局部场电位的视觉信息整合特性研究[D];郑州大学;2015年

2 凡思武;基于视觉信息和树匹配的Deep Web数据抽取问题的研究[D];山东大学;2015年

3 李雯琴;基于图模型的Web表格中视觉信息的研究[D];复旦大学;2014年

4 田丽;品牌视觉信息的图形动态化创意呈现[D];南昌大学;2015年

5 胡义坦;基于视觉信息的无人机着陆参数估计技术研究[D];南京航空航天大学;2014年

6 王理军;基于多体素模式分析的fMRI视觉信息解码技术研究[D];解放军信息工程大学;2014年

7 胡泽铭;数字界面视觉信息认知ERP实验研究[D];东南大学;2015年

8 刘嘉丽;“中国—南亚博览会”展示设计的视觉信息传达研究[D];云南艺术学院;2016年

9 王红旗;基于视觉信息的机械手对刚性椭球体的抓取稳定性研究[D];河南理工大学;2015年

10 何晋烨;博物馆视觉信息设计中的字体形态研究[D];华中师范大学;2016年



本文编号:2131224

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2131224.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e8fa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com