基于申威26010处理器的扩展函数库实现与优化
发布时间:2019-10-18 11:56
【摘要】:Intel,AMD和IBM都具有针对自身特点的向量扩展库。相比于传统的标量计算,向量化技术带来的加速比较高。为此,针对申威26010处理器开发向量数学库软件。在分析函数常用级数法和迭代法算法的基础上,结合三角函数、反三角函数、指数函数和对数函数研究一种高效向量化算法,并对其进行实现与优化,使其支持函数高精度和高性能计算,并且满足浮点运算的要求。测试结果表明,该算法精度达到申威26010处理器上特定应用的要求,与Intel VML数学库相比,各函数的平均加速比均达到1.1以上。
【图文】:
嘌院,
本文编号:2551075
【图文】:
嘌院,
本文编号:2551075
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2551075.html