朱古力：如果只有一小批装入内存我能做些什么？朱古力：如果只有一小批装入内存我能做些什么？(Caffe

2019-05-12 02:33发布

站内文章 / 前沿技术

43 0

女 | 书童

私信

我想培养一个非常大的模型。所以，我只能适合一个非常小批量到GPU内存。小批量的工作结果与非常嘈杂的坡度估计。
我能做些什么来避免这个问题？

Answer 1:

您可以更改iter_size在求解器参数。 CAFFE日积月累梯度iter_size X batch_size实例中的每个随机梯度下降步骤。因此，增加iter_size当你不能使用的batch_size大，由于有限的内存也可以得到比较稳定的梯度。

正如指出这个帖子，批量大小不是理论问题（随机梯度下降的效率已被证明具有批量1）。确保你正确地贯彻执行批处理（样品应随机挑选您的数据）。

文章来源: Caffe: What can I do if only a small batch fits into memory?

标签： machine-learning neural-network deep-learning caffe gradient-descent

狗以群分

女 | 书童

私信

Ta的文章更多文章

0条评论

还没有人评论过~