当前位置:主页 > 科技论文 > 计算机论文 >

基于多核处理器的数值算法并行优化究

发布时间:2020-08-23 14:38
【摘要】:随着多核计算机的日益普及,大规模科学与工程计算、事务处理与商业计算的需求,以及数据挖掘应用领域的不断扩大,基于多核平台的线性方程组数值求解算法和大数据量数值关联规则算法的研究显得非常重要。由于多核技术会增加多线程的创建、通信和销毁等开销,如何有效发现程序中的可并行性能、优化多核并行程序及发挥多核的最佳性能,成为高性能计算领域研究的重要课题。 本文给出了Cholesky分解算法的详细推导过程,分析了Cholesky分解并行按照块分配的任务分配策略存在负载不均衡,提出了块交叉分配方案,并与卷帘分配方案对比。对这三种算法均采用了提前发送策略,并在MPI集群系统上进行了实验和分析。针对Cholesky分解基于MPI的并行算法设计复杂、进程负载均衡困难、消息传递和数据移动开销大问题,以及基于多核采用OpenMP并行化的并行性开销增大和线程负载不平衡的问题,着重考虑多核计算机的优势,提出了一种基于任务划分的Cholesky分解多核并行优化算法。该算法将大循环问题划分成各个相互独立的小任务,并运用递归技术任务窃取技术和动态负载均衡算法使这些任务能够并行完成。 在分析了关联规则挖掘Apriori算法及其并行算法存在的不足的基础上,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术,对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘,提高关联规则挖掘效率和多核CPU的利用率。 算法程序设计过程引入了Intel Parallel Studio并行套件,对基于多核的并行算法进行内存线程检查和性能优化,消除采用多核平台并行化所造成的数据泄漏数据竞争死锁和效率低等问题。实验结果证明基于多核所提出的算法具有较高的并行效率和较好的加速比。
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP338.6
【图文】:

并行开发,优化流程,多线程


allel Composer:编译器和库组建并调试 C/C++应用软件,主要器、IPP 性能库、TBB 多线程开发库。编译器中含有 OpenMP 多线的支持;而 TBB 多线程开发库集合了很多多线程算法和数据结程的开发。allel Inspector:内存与多线程错误检查器,可以寻找会造成从而验证并进而提高代码的可靠性和质量。allel Amplifier:是一个性能分析器,迅速查找多线程程序在,告诉使用者软件的扩展性和并行度,快速提高应用软件本身llel Studio 工具上对程序并行化开发,流程一般按照图 3.1 所

界面图,并行开发,多核,界面图


3) 安装英特尔 Parallel Studio 并导入授权文件,具体组件包括: Paser、性能基本库 IPP、线程构建模块 TBB、Parallel Inspector 及 Pafier。4) 安装后,Parallel Studio 工具和 Visual Studio 2008 的开发界面如图

对应关系,进程,节点,算法


图 4.1 块与节点的存储对应关系ock and the corresponding relationship between th算法具体步骤如下:下三角部分分别发送到各个进程, 按照务,每块的大小m= n /( 2 p) ,每个节点p-1依次计算;ank==i)进行如下操作:1块进行计算:k,j) f(k,j) ,并广播f(k,j);…,m-1),(k=j+m*my_rank,…,M-1)2块进行计算:k)-f(w,j)*f(m*my_rank+k,j)/f(j+m*my_a(0,w,j+1);(k=j+1,…,m-1), (w= j+m*ank!=i) 进行如下操作:

【参考文献】

相关期刊论文 前10条

1 张锦雄;韦化;;基于OpenMP的对称矩阵LDL~T分解并行算法实现[J];广西科学院学报;2008年03期

2 陈建平,Jerzy Wasniew ski;Cholesky分解递归算法与改进[J];计算机研究与发展;2001年08期

3 宋威;杨炳儒;徐章艳;高静;;一种改进的频繁闭项集挖掘算法[J];计算机研究与发展;2008年02期

4 叶德谦;赵世磊;;基于线性回归的关联规则相关性方法的研究[J];计算机研究与发展;2008年S1期

5 曾万聃;周绪波;戴勃;常桂然;李春平;;关联规则挖掘的矩阵算法[J];计算机工程;2006年02期

6 李成军;杨天奇;;一种改进的加权关联规则挖掘方法[J];计算机工程;2010年07期

7 杨川;杨斌;;基于TBB的傅里叶变换多核并行化实现[J];计算机工程;2010年16期

8 邬贵明;窦勇;王淼;;Cholesky分解细粒度并行算法[J];计算机工程与科学;2010年09期

9 单莹;吴建平;王正华;;基于SMP集群的多层次并行编程模型与并行优化技术[J];计算机应用研究;2006年10期

10 王丹阳;田卫东;胡学钢;;一种有效的并行频繁项集挖掘算法[J];计算机应用研究;2008年11期

相关硕士学位论文 前8条

1 邢芳;基于集群系统并行求解线性方程组的设计与实现[D];辽宁师范大学;2010年

2 阴斐;LINUX集群可视化监测工具的研究与实现技术[D];郑州大学;2005年

3 孙静姝;一种改进的并行关联规则挖掘算法[D];哈尔滨工程大学;2007年

4 佟强;Linux集群上并行I/O与核外存储策略的研究与实现[D];哈尔滨工业大学;2002年

5 王荧;并行关联规则算法优化的研究[D];山东科技大学;2007年

6 伊君翰;基于多核的并行编程模型[D];复旦大学;2008年

7 郭慎;基于多核的程序并行优化的研究与实现[D];苏州大学;2010年

8 陈林;基于多核架构体系的图像配准并行计算方法研究[D];云南大学;2010年



本文编号:2801647

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2801647.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户65299***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com