基于区块链的数据联合分类算法研究
发布时间:2021-01-21 17:12
分类问题作为人工智能领域尤其是数据挖掘方向的一个重要问题,广泛存在于语音及图像识别、计算机视觉分析与处理等大数据应用场景,近年来深受学者关注,诸多相应分类算法也陆续提出。在设计各种分类算法的过程中,分类学习模型的训练生成是至关重要的一环。在训练集数据量足够大且对应数据质量较高的前提下,得出的学习模型分类精度一般相应较高。本文紧密结合区块链技术从如何确保数据总量和如何保证数据质量两方面入手,旨在提出设计分布式环境高精度分类算法的有效解决方案。主要研究内容如下:(1)不同行业的数据往往产生于各分布式区域环境,同一行业的数据产生也具有较高的分布性和独立性,大数据挖掘应用需要整合一定规模的数据进行模型训练,经常会因数据的私密性而遇到数据壁垒问题,难以促成各数据拥有方进行有效数据共享。为解决该分布式隐私数据共享问题,本文提出一种基于区块链技术的加密数据联合方案以打破分类学习数据壁垒,使得互不信任的相关数据拥有方之间在智能合约基础上进行加密数据共享以确保数据集规模足够大,从而提高分类学习算法的分类精度等性能。(2)在上述数据共享方案的基础上提出了基于区块链的ID3决策树数据联合分类算法BDTC,利...
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
genesis.json文件配置内容(3)搭建联盟链
硕士学位论文323.6.3实验过程本节使用基于浏览器的IDE环境Remix进行智能合约的编写与测试,编写成功后再进入联盟链控制台进行部署。如图3-7所示为合约的编写,本文在合约中定义了两个结构体,分别是数据请求方结构体和数据拥有方结构体,在结构体中定义了账户地址、余额以及按照索引存储双方信息的映射关系等;合约编写成功后可点击Run下的Deploy进行合约部署,测试结果如图3-8所示。在中可以添加节点账户地址,最后保存于存放数据请求放的列表中。功能中输入数据分类前后的两个精度进行精度提升值的计算,第三个变量为数据请求方在列表中的索引,即为此次交易到账地址。与的取值本文取精确度小数点后三位并进行整数间近似计算,取值为数据传输后的精度数据融合后的分类精度最大值。图3-6节点联通情况
基于区块链的数据联合分类算法研究33图3-7智能合约部署图图3-8合约测试结果图3.6.4实验结果(1)数据分类阶段本节通过仿真实验表明通过加密数据共享,在保证数据隐私不泄露的情况下,促进隐私数据共享进而提升数据分类挖掘中分类精度,数据参与方基于联盟链达成数据交易,实现高质量数据共享,进行决策树ID3分类算法并有效提高其模型分类精度。根据3.6.1中搭建的实验环境,本文共搭建了四个节点,节点A、B、C、D互相作为数据请求方与数据拥有方。本章所提出的BDTC算法的数据分类实验结果如图3-9所示,其中(a)图表示A节点加密数据分类精度图、(b)图表示B节点加密数据分类精度图、(c)图表示C节点加密数据分类精度图、(d)图表示D节点加密数据分类精度图。图3-9中的(a)(b)(c)(d)四幅图,每幅图均由数据请求方节点训练生成。横坐标表示训练分类模型所使用的数据集大小,纵坐标表示生成模型的分类精度。图中每一条曲线从同一起点出发,该起点则表示数据请求方节点使用本地10000条明文数据所训练生成模型产生的分类精度值(实验中使用本地10000条明文数据并不代表本地仅10000个数据)。横坐标以4000恒定增长表示联盟链中的数据请求方节点将数据拥有方节点所共享的加密数据分批次与本地加密数据联合进行训练且每次增加数据量为4000条;当横坐标为10000时,纵坐标所对应的精度
【参考文献】:
期刊论文
[1]高性能联盟区块链技术研究[J]. 朱立,俞欢,詹士潇,邱炜伟,李启雷. 软件学报. 2019(06)
[2]区块链安全问题:研究现状与展望[J]. 韩璇,袁勇,王飞跃. 自动化学报. 2019(01)
[3]区块链技术对人工智能的影响[J]. 潘吉飞,黄德才. 计算机科学. 2018(S2)
[4]一种基于混合二叉树结构的多类支持向量机分类算法[J]. 冷强奎,刘福德,秦玉平. 计算机科学. 2018(05)
[5]同态加密在加密机器学习中的应用研究综述[J]. 崔建京,龙军,闵尔学,于洋,殷建平. 计算机科学. 2018(04)
[6]区块链技术发展现状与展望[J]. 袁勇,王飞跃. 自动化学报. 2016(04)
硕士论文
[1]基于BP神经网络的分类器改进算法研究与应用[D]. 李圆满.中国地质大学(北京) 2019
[2]隐私保护卷积神经网络前向传播方法研究[D]. 许世聪.西安电子科技大学 2019
[3]基于同态加密隐私保护的机器学习关键技术研究[D]. 何伟超.电子科技大学 2019
[4]基于随机森林的深度网络模型及其在图像分类上的应用[D]. 侯艳路.中国矿业大学 2018
[5]基于Spark分布式平台的随机森林分类算法研究[D]. 牛志华.中国民航大学 2017
本文编号:2991569
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
genesis.json文件配置内容(3)搭建联盟链
硕士学位论文323.6.3实验过程本节使用基于浏览器的IDE环境Remix进行智能合约的编写与测试,编写成功后再进入联盟链控制台进行部署。如图3-7所示为合约的编写,本文在合约中定义了两个结构体,分别是数据请求方结构体和数据拥有方结构体,在结构体中定义了账户地址、余额以及按照索引存储双方信息的映射关系等;合约编写成功后可点击Run下的Deploy进行合约部署,测试结果如图3-8所示。在中可以添加节点账户地址,最后保存于存放数据请求放的列表中。功能中输入数据分类前后的两个精度进行精度提升值的计算,第三个变量为数据请求方在列表中的索引,即为此次交易到账地址。与的取值本文取精确度小数点后三位并进行整数间近似计算,取值为数据传输后的精度数据融合后的分类精度最大值。图3-6节点联通情况
基于区块链的数据联合分类算法研究33图3-7智能合约部署图图3-8合约测试结果图3.6.4实验结果(1)数据分类阶段本节通过仿真实验表明通过加密数据共享,在保证数据隐私不泄露的情况下,促进隐私数据共享进而提升数据分类挖掘中分类精度,数据参与方基于联盟链达成数据交易,实现高质量数据共享,进行决策树ID3分类算法并有效提高其模型分类精度。根据3.6.1中搭建的实验环境,本文共搭建了四个节点,节点A、B、C、D互相作为数据请求方与数据拥有方。本章所提出的BDTC算法的数据分类实验结果如图3-9所示,其中(a)图表示A节点加密数据分类精度图、(b)图表示B节点加密数据分类精度图、(c)图表示C节点加密数据分类精度图、(d)图表示D节点加密数据分类精度图。图3-9中的(a)(b)(c)(d)四幅图,每幅图均由数据请求方节点训练生成。横坐标表示训练分类模型所使用的数据集大小,纵坐标表示生成模型的分类精度。图中每一条曲线从同一起点出发,该起点则表示数据请求方节点使用本地10000条明文数据所训练生成模型产生的分类精度值(实验中使用本地10000条明文数据并不代表本地仅10000个数据)。横坐标以4000恒定增长表示联盟链中的数据请求方节点将数据拥有方节点所共享的加密数据分批次与本地加密数据联合进行训练且每次增加数据量为4000条;当横坐标为10000时,纵坐标所对应的精度
【参考文献】:
期刊论文
[1]高性能联盟区块链技术研究[J]. 朱立,俞欢,詹士潇,邱炜伟,李启雷. 软件学报. 2019(06)
[2]区块链安全问题:研究现状与展望[J]. 韩璇,袁勇,王飞跃. 自动化学报. 2019(01)
[3]区块链技术对人工智能的影响[J]. 潘吉飞,黄德才. 计算机科学. 2018(S2)
[4]一种基于混合二叉树结构的多类支持向量机分类算法[J]. 冷强奎,刘福德,秦玉平. 计算机科学. 2018(05)
[5]同态加密在加密机器学习中的应用研究综述[J]. 崔建京,龙军,闵尔学,于洋,殷建平. 计算机科学. 2018(04)
[6]区块链技术发展现状与展望[J]. 袁勇,王飞跃. 自动化学报. 2016(04)
硕士论文
[1]基于BP神经网络的分类器改进算法研究与应用[D]. 李圆满.中国地质大学(北京) 2019
[2]隐私保护卷积神经网络前向传播方法研究[D]. 许世聪.西安电子科技大学 2019
[3]基于同态加密隐私保护的机器学习关键技术研究[D]. 何伟超.电子科技大学 2019
[4]基于随机森林的深度网络模型及其在图像分类上的应用[D]. 侯艳路.中国矿业大学 2018
[5]基于Spark分布式平台的随机森林分类算法研究[D]. 牛志华.中国民航大学 2017
本文编号:2991569
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2991569.html