我的工作比较研究中,我必须做的一个算法的串行和并行版本的比较(NSGA-II算法精确这里下载链接 )。 NSGA-II是一种启发式的优化方法,并因此依赖于生成初始随机群体。 如果使用的是CPU和GPU所产生的初始群体是不同的,那么我无法做出公正的加速研究。
我拥有它具有1.3的计算能力的NVIDIA特斯拉-C1060卡。 按照这个前面回答和本NVIDIA文件 ,我们不能指望一个sm_13装置总是产生一个IEEE-754标准浮法(单精度)值。 这在其他词的意思是,我目前的设备上,我不能进行相应的串口对应的CUDA程序的公正加速研究。
我的问题是:会切换到Fermi架构解决这个问题?