异步glReadPixels与PBO(Asynchronous glReadPixels with

我想用两个公益组织来读取另一种方式像素。我认为PBO方式会更快，因为glReadPixels使用PBO时，和很多的时间可以重叠立即返回。

奇怪的是，似乎没有太大的好处。考虑到像一些代码：

    glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, 0);
    Timer t; t.start();
    glReadPixels(0,0,1024,1024,GL_RGBA, GL_UNSIGNED_BYTE, buf);
    t.stop(); std::cout << t.getElapsedTimeInMilliSec() << " ";

    glBindBufferARB(GL_PIXEL_PACK_BUFFER_ARB, pbo);
    t.start();
    glReadPixels(0,0,1024,1024,GL_RGBA, GL_UNSIGNED_BYTE, 0);
    t.stop(); std::cout << t.getElapsedTimeInMilliSec() << std::endl;

其结果是

1.301 1.185
1.294 1.19
1.28 1.191
1.341 1.254
1.327 1.201
1.304 1.19
1.352 1.235

PBO的方法是快一点，但不是一个令人满意的即时回报 。

我的问题是：

什么是影响glReadPixels'性能因素是什么？ Somethimes，它的成本在这里达到10毫秒，而1.3ms。
~~为什么要立即退回费用高达1.2ms的？是不是过大或只是正常的？~~

================================================== =========================

根据与演示相比较，我发现了两个因素：

GL_BGRA比GL_RGBA，1.3ms => 1.0ms的（无PBO），1.2ms的=> 0.9ms更好（与PBO）
glutInitDisplayMode（GLUT_RGB | GLUT_ALPHA），而不是GLUT_RGBA，0.9ms => 0.01ms.That就是我想要的性能。在我的系统，GLUT_RGBA = GLUT_RGB = 0。 GLUT_ALPHA = 8

接着又两个问题：