在CUDA视觉分析器,第5版,我知道了“GLD / st_requested_throughput”是请求的内存吞吐量的应用。 然而,当我试图找到硬件的实际吞吐量,我很困惑,因为有两对指标这似乎是合格的,而他们是“GLD / st_throughput”和“dram_read / write_throughput”。 这对实际上是硬件吞吐量是多少? 又是什么其他的作为?
Answer 1:
gld/st_throughput
包括由L1和L2高速缓存服务的交易。 虽然dram_read/write_throughput
是L2和设备存储器之间的吞吐量。 所以,对待每全局内存访问计数gld/st_throughput
但只请求错过两个L1和L2缓存对数dram_read/write_throughput
。
我还没有发现柜台的一个很好的概述的任何地方。 希望NVIDIA将提供...
文章来源: What's the difference between “gld/st_throughput” and “dram_read/write_throughput” metrics?