Fermi架构可以解决我的比较研究?(Fermi architecture possible sol

2019-09-16 18:43发布

我的工作比较研究中,我必须做的一个算法的串行和并行版本的比较(NSGA-II算法精确这里下载链接 )。 NSGA-II是一种启发式的优化方法,并因此依赖于生成初始随机群体。 如果使用的是CPU和GPU所产生的初始群体是不同的,那么我无法做出公正的加速研究。

我拥有它具有1.3的计算能力的NVIDIA特斯拉-C1060卡。 按照这个前面回答和本NVIDIA文件 ,我们不能指望一个sm_13装置总是产生一个IEEE-754标准浮法(单精度)值。 这在其他词的意思是,我目前的设备上,我不能进行相应的串口对应的CUDA程序的公正加速研究。

我的问题是:会切换到Fermi架构解决这个问题?

Answer 1:

浮点运算将产生不同的架构不同的结果,不管他们是否支持IEEE754与否,因为浮点不关联。 即使是在x86编译器开关通常会给出不同的结果。 此白皮书提供了一些优秀的解释。

说了这么多,你真正的问题是,你必须依赖于数据的算法,其中的操作依赖于您生成随机数。 所以,如果你产生了CPU和GPU那么这两个运行将遵循同样的路径上相同的数字。 考虑使用cuRAND ,可在CPU和GPU上都产生了相同的数字。



文章来源: Fermi architecture possible solution to my comparative study?