可视图表的逆向数据解释

发布时间：2021-07-22 07:32

　　可视图表通常作为一种图形化的展示方式,以便于人们对数字数据的理解。然而对于一些古老的图表,其原始的数据可能已经丢失,另外在科学文献中,大部分图表的原始数据也是不可用的,这些存在问题都阻碍了更有效可视化的设计和进一步分析图表的过程。本文对可视图表的逆向数据解释提供了一种有效的分析方法。本文实现了Chart Decoder,一个实现视觉特征解码并从图表图像中恢复数据的系统。通过将可视图表图像作为输入,该系统应用深度学习技术实现了图表类型分类,同时利用计算机视觉和文本识别技术对图表图像中的文本和图形进行分析,实现了潜在数据的自动生成。Chart Decoder通过训练基于深度学习的分类器可以识别五个类别的图表类型（条形图,饼图,折线图,散点图和雷达图）,其分类精度达到99%以上。同时对于文本信息提取,本文提供了一种有效的文本定位和识别方式,并对文本内容根据其在图表中的角色进行了分类。为了评估本文算法的有效性,本文在两个图表语料库上评估了该系统:1)从网络上收集的可视图表,2)由程序脚本自动生成图表。结果表明,本文所实现系统能够以高精度从可视图表中恢复数据。

【文章来源】：天津大学天津市 211工程院校 985工程院校教育部直属院校

【文章页数】：55 页

【学位级别】：硕士

【部分图文】：

可视图表的逆向数据解释

AlexNet的模型结构[8]

模型图,模型,卷积核,卷积

天津大学硕士学位论文82.1.2GoogLeNet在提升网络性能的方法上，一种最直接和方便的方式就是增加卷积网络的层出和神经元数，但是这种方式同样也带来了大量的参数计算，容易导致增加计算量和过拟合，另外网络层数越深，还越容易出现梯度弥散问题。GoogLeNet增加了Inception结构来处理这个问题，通过将稀疏矩阵以聚类的方式转变为密集的子矩阵来减少计算量。Inception结构的主要思想是考虑如何通过容易获得的密集组件来近似和覆盖卷积视觉网络的最佳局部稀疏结构，只要找到最佳的局部结构并在空间上重复就可以实现这个结构。图2-2Inception结构的最初模型[9]如图2-2所示，最初的Inception结构采用了1×1，3×3，5×5大小不同的卷积核。感受野代表了不同神经元对原图像感受范围的大小，而此图中不同卷积核的大小则代表着不同大小的感受野。卷积核大小的不同表示图片提取特征的差异，这种差异可以通过拼接不同的卷积核进行不同尺度特征的融合。此外，由于池化操作对于当前卷积网络的成功至关重要，所以该结构也保留了池化操作。然而，Inception的最初模型造成了大量的计算量，为了减少计算量，Inceptionv1版本对卷积进行了降维，用一个1×1的卷积核来降低特征图的厚度。1×1卷积核的增加不仅减少了维度，还修正了ReLU激活函数。如图2-3所示，在3×3，5×5卷积操作之前和最大池化之后分别添加了1×1维度的卷积核。

模型图,模型,网络结构,结构数据

第二章相关技术与开发工具介绍9图2-3Inceptionv1的结构模型[9]基于Inception结构，GoogLeNet有22层网络（包含池化层的话，一共有27层）。下图2-4给出了GoogLeNet的详细结构数据。该网络采用了模块化的网络结构，使得增加和修改网络结构更加方便。同时GoogLeNet采用了均值池化层来代替全连接层，GoogLeNet的文章中指出，该改变将top1的准确率提升了0.6%。在模型中，平均池化层之后仍然使用了Dropout操作。图2-4GoogLeNet的模型结构[9]

本文编号：3296723

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3296723.html

上一篇：多驱动煤矿救援机器人行走系统与驱动模式自适应控制研究
下一篇：基于循环神经网络的胎儿心电提取方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|