基于GPU加速的仿生智能计算方法研究
发布时间:2020-12-09 14:26
人们在日常生产生活中会遇到大量的复杂优化问题。这些复杂优化问题很难在合理的时间范围内采用常规方法解决。自然界中的生物行为往往趋向于对自我或种群有利的方向繁衍和进化。随着对仿生智能计算方法研究的不断深入,群体智能算法作为一种重要的计算方法在最优化领域得到了广泛的应用。由于应用场景的扩大和问题复杂度的提高,如果群体智能算法采用大规模种群进行寻优,将存在寻优效率低和耗时较长的问题。近年来,随着计算机图形硬件的快速发展,由于其高速的数据处理能力和逐渐成熟的软件编程体系,其逐渐在通用计算领域得到了越来越多的应用。针对上述问题,可以基于GPU从异构计算的角度研究仿生优化算法的内在并行特性,从而对算法进行优化和加速。本文通过分析不同粒度下的群体智能算法的并行设计方案,提出了一种并行群体智能优化算法设计方法,并解决了其中涉及到的关键问题。进而设计实现了并行粒子群算法、并行人工蜂群算法和并行人工鱼群算法。实验表明本文设计的并行算法能够有效提高群体智能算法的执行效率,证明了所提方法的有效性和高效性。图像分割是数字图像处理和计算机视觉领域的关键技术之一。阈值法由于其实现简单和性能稳定而被广泛应用。多阈值分割...
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
CPU和GPU的适用性对比
梦时匦胪ü?褂胈_syncthreads()实现同步。常量内存通过__constant__定义,其最大容量被限制为64KB。纹理内存是一种特殊的全局内存,是只读存储器。全局内存是GPU中容量最大、最常使用但却是访问延迟最高的内存空间,为设备端所有线程共享。CPUSharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)GlobalMemoryConstantMemoryTextureMemoryGPUGridBlock(0,0)SharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)Block(1,0)图2-5CUDA内存模型
第2章仿生智能计算方法与GPU通用计算192.3.4CUDA软件体系CUDA软件体系包括三个层次,从高到低依次为:CUDA库函数、CUDA运行时API和CUDA驱动API。如图2-6所示。CPUGPUApplicationsCUDALibrariesCUDARuntimeCUDADriver图2-6CUDA软件体系驱动API属于底层API,能够提供使用GPU设备的方法。运行时API基于驱动API,其函数将会分解成多个基本操作由驱动API实现。从CUDA3.2开始,CUDA开发不再局限于一种API的实现[61]。开发人员可根据实际情况自由选择这三种API。除此之外,CUDA提供了多种辅助软件开发工具,包括nvcc编译器、CUDA-gdb调试器、各种函数库等。这些开发工具大大方便和简化了基于GPU的应用开发。2.4本章小结本章主要介绍了仿生智能计算方法与GPU通用计算的基本知识。首先介绍了最优化问题,这是仿生智能计算应用最广泛的领域之一。其次介绍了仿生智能计算方法中重要的群体智能算法,重点介绍了其中的粒子群算法、人工蜂群算法及人工鱼群算法的原理及算法流程。最后介绍了GPU通用计算的起源及发展,对GPU的软硬件模型及相关工具进行了简单介绍。本章内容为下面的工作提供了理论和技术指导。下一章将重点阐述群体智能算法在CUDA平台上的并行化研究、设计、实现及验证和测试。
【参考文献】:
期刊论文
[1]基于改进混合蛙跳算法的图像阈值分割算法[J]. 刘立群,火久元,王联国. 计算机应用与软件. 2015(05)
[2]自适应视野和步长的改进人工鱼群算法[J]. 刘彦君,江铭炎. 计算机工程与应用. 2009(25)
[3]基于MPI的并行蚁群算法的研究与实现[J]. 刘东,常静,魏文红,赵洁. 广东工业大学学报. 2008(01)
[4]一种基于GPU加速的细粒度并行粒子群算法[J]. 李建明,万单领,迟忠先,胡祥培. 哈尔滨工业大学学报. 2006(12)
[5]基于粒子群优化算法的多阈值图像分割[J]. 韦苗苗,江铭炎. 山东大学学报(工学版). 2005(06)
[6]一种新的求解复杂函数优化问题的并行粒子群算法[J]. 赵勇,岳继光,李炳宇,张传升. 计算机工程与应用. 2005(16)
[7]组合优化问题的人工鱼群算法应用[J]. 李晓磊,路飞,田国会,钱积新. 山东大学学报(工学版). 2004(05)
[8]基于人工鱼群算法的参数估计方法[J]. 李晓磊,薛云灿,路飞,田国会. 山东大学学报(工学版). 2004(03)
[9]一种基于动物自治体的寻优模式:鱼群算法[J]. 李晓磊,邵之江,钱积新. 系统工程理论与实践. 2002(11)
[10]基于自动分析直方图灰度分布的数字图像阈值化算法[J]. 高春鸣,兰秋军. 计算机科学. 2001(04)
博士论文
[1]一种新型的智能优化方法-人工鱼群算法[D]. 李晓磊.浙江大学 2003
硕士论文
[1]多粒子群优化算法的串行硬件结构实现[D]. 王培坤.华南理工大学 2016
[2]粒子群算法的改进及应用[D]. 徐玉杰.南京师范大学 2013
[3]粒子群算法的硬件实现及性能分析[D]. 蔡瑞.江南大学 2009
[4]基于FPGA的蚁群算法硬件化技术研究[D]. 刘沙莉.哈尔滨工程大学 2009
本文编号:2907013
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
CPU和GPU的适用性对比
梦时匦胪ü?褂胈_syncthreads()实现同步。常量内存通过__constant__定义,其最大容量被限制为64KB。纹理内存是一种特殊的全局内存,是只读存储器。全局内存是GPU中容量最大、最常使用但却是访问延迟最高的内存空间,为设备端所有线程共享。CPUSharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)GlobalMemoryConstantMemoryTextureMemoryGPUGridBlock(0,0)SharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)Block(1,0)图2-5CUDA内存模型
第2章仿生智能计算方法与GPU通用计算192.3.4CUDA软件体系CUDA软件体系包括三个层次,从高到低依次为:CUDA库函数、CUDA运行时API和CUDA驱动API。如图2-6所示。CPUGPUApplicationsCUDALibrariesCUDARuntimeCUDADriver图2-6CUDA软件体系驱动API属于底层API,能够提供使用GPU设备的方法。运行时API基于驱动API,其函数将会分解成多个基本操作由驱动API实现。从CUDA3.2开始,CUDA开发不再局限于一种API的实现[61]。开发人员可根据实际情况自由选择这三种API。除此之外,CUDA提供了多种辅助软件开发工具,包括nvcc编译器、CUDA-gdb调试器、各种函数库等。这些开发工具大大方便和简化了基于GPU的应用开发。2.4本章小结本章主要介绍了仿生智能计算方法与GPU通用计算的基本知识。首先介绍了最优化问题,这是仿生智能计算应用最广泛的领域之一。其次介绍了仿生智能计算方法中重要的群体智能算法,重点介绍了其中的粒子群算法、人工蜂群算法及人工鱼群算法的原理及算法流程。最后介绍了GPU通用计算的起源及发展,对GPU的软硬件模型及相关工具进行了简单介绍。本章内容为下面的工作提供了理论和技术指导。下一章将重点阐述群体智能算法在CUDA平台上的并行化研究、设计、实现及验证和测试。
【参考文献】:
期刊论文
[1]基于改进混合蛙跳算法的图像阈值分割算法[J]. 刘立群,火久元,王联国. 计算机应用与软件. 2015(05)
[2]自适应视野和步长的改进人工鱼群算法[J]. 刘彦君,江铭炎. 计算机工程与应用. 2009(25)
[3]基于MPI的并行蚁群算法的研究与实现[J]. 刘东,常静,魏文红,赵洁. 广东工业大学学报. 2008(01)
[4]一种基于GPU加速的细粒度并行粒子群算法[J]. 李建明,万单领,迟忠先,胡祥培. 哈尔滨工业大学学报. 2006(12)
[5]基于粒子群优化算法的多阈值图像分割[J]. 韦苗苗,江铭炎. 山东大学学报(工学版). 2005(06)
[6]一种新的求解复杂函数优化问题的并行粒子群算法[J]. 赵勇,岳继光,李炳宇,张传升. 计算机工程与应用. 2005(16)
[7]组合优化问题的人工鱼群算法应用[J]. 李晓磊,路飞,田国会,钱积新. 山东大学学报(工学版). 2004(05)
[8]基于人工鱼群算法的参数估计方法[J]. 李晓磊,薛云灿,路飞,田国会. 山东大学学报(工学版). 2004(03)
[9]一种基于动物自治体的寻优模式:鱼群算法[J]. 李晓磊,邵之江,钱积新. 系统工程理论与实践. 2002(11)
[10]基于自动分析直方图灰度分布的数字图像阈值化算法[J]. 高春鸣,兰秋军. 计算机科学. 2001(04)
博士论文
[1]一种新型的智能优化方法-人工鱼群算法[D]. 李晓磊.浙江大学 2003
硕士论文
[1]多粒子群优化算法的串行硬件结构实现[D]. 王培坤.华南理工大学 2016
[2]粒子群算法的改进及应用[D]. 徐玉杰.南京师范大学 2013
[3]粒子群算法的硬件实现及性能分析[D]. 蔡瑞.江南大学 2009
[4]基于FPGA的蚁群算法硬件化技术研究[D]. 刘沙莉.哈尔滨工程大学 2009
本文编号:2907013
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2907013.html