伯克利人工智能研究所专家分享新型强化学习库 rlpyt

来自伯克利人工智能研究所的研究人员 Adam Stooke 分享了 pytorch 中的一个新的强化学习库 rlpyt，其中不仅包括了强化学习模块优化实现，还提供支持所有三个主要的无模型算法系列：政策梯度，深度学习和 q 函数政策梯度，致力于成为中小规模小规模研究的高吞吐量代码库。 [原文链接]