来自伯克利人工智能研究所的研究人员 Adam Stooke 分享了 pytorch 中的一个新的强化学习库 rlpyt,其中不仅包括了强化学习模块优化实现,还提供支持所有三个主要的无模型算法系列:政策梯度,深度学习和 q 函数政策梯度,致力于成为中小规模小规模研究的高吞吐量代码库。 [原文链接]
来自伯克利人工智能研究所的研究人员 Adam Stooke 分享了 pytorch 中的一个新的强化学习库 rlpyt,其中不仅包括了强化学习模块优化实现,还提供支持所有三个主要的无模型算法系列:政策梯度,深度学习和 q 函数政策梯度,致力于成为中小规模小规模研究的高吞吐量代码库。 [原文链接]