是否有人有两种编程经验英特尔数学核心函数库和AMD核心数学库 ? ,我建立了高性能的统计计算个人电脑和我辩论上购买的组件。 AMD的数学核心库的魅力在于它是免费的,但我在学术界所以MKL是不贵。 但我很感兴趣听到的想法:
- 它提供了一个更好的API?
- 它提供了更好的性能,平均每美元,包括许可证和硬件成本。
- 是AMCL-GPU ,我应该考虑的一个因素?
是否有人有两种编程经验英特尔数学核心函数库和AMD核心数学库 ? ,我建立了高性能的统计计算个人电脑和我辩论上购买的组件。 AMD的数学核心库的魅力在于它是免费的,但我在学术界所以MKL是不贵。 但我很感兴趣听到的想法:
英特尔MKL和ACML也有类似的API,但MKL具有更丰富的支持功能,包括BLAS(和CBLAS)/ LAPACK / FFT的/矢量和统计数学/稀疏直接和迭代求解器/稀疏BLAS,等等。 英特尔MKL还为英特尔和AMD处理器进行了优化,并有一个活跃的用户论坛,你可以寻求帮助或指导。 这两个库的独立评估张贴在这里:( http://www.advancedclustering.com/company-blog/high-performance-linpack-on-xeon-5500-v-opteron-2400.html )
•巴蒂尔科德,先进的集群(也由HPCWire进行:基准测试挑战:Nehalem的对战伊斯坦布尔):“在我们最近的测试中,并通过现实世界的经验,我们发现,英特尔编译器与英特尔数学核心函数库(MKL)通常提供最棒的表演。 而不是仅仅解决英特尔的工具,我们尝试了各种各样的编译器,包括:英特尔,GNU编译器和波特兰集团。 我们还测试了各种线性代数库包括:MKL,AMD核心数学库(ACML),以及libGOTO从得克萨斯大学。 所有的测试结果显示同时使用英特尔编译器与英特尔数学库的时候,我们可以实现最高的性能 - 即使是在AMD系统 - 所以这些是把他们当作我们的测试的基础” [基准测试显示,4芯在74.0GFs Nehalem处理器X5550 2.66GHz的对比在99.4GFs伊斯坦布尔2435 2.6GHz的; 伊斯坦布尔更只有34%的速度,尽管50%的核]
希望这可以帮助。
事实上,也有ACML LAPACK例程的两个版本。 不带尾随下划线(_)中的那些是C-版本程序,其作为维克多说,不要求工作空间阵列,您只需通过而不是为参数引用值。 然而,随着下划线的那些都只是香草Fortran例程。 做一个libacml_dll.dll“DUMPBIN /出口”,你会看到的。
我已经使用AMCL其BLAS / LAPACK程序,所以这可能不会回答你的问题,但我希望它是有用的人。 比较它们以香草BLAS / LAPACK,他们的成绩是2-3,我特别使用情况较好的一个因素。 我用了非对称密复杂的基质,对于线性求解和特征系统计算。 你应该知道,函数的声明是不相同的香草例程。 这需要预处理宏的大量的,让我自由地在两者之间切换。 尤其是在AMCL所有LAPACK程序不需要工作的阵列。 这是一个重大的方便,如果AMCL是将要使用的唯一库。