Acme — это фреймворк на базе Python, упрощающий разработку и оценку агентов обучения с подкреплением. Он включает коллекцию заранее созданных реализаций агентов (например, DQN, PPO, SAC), оболочки для среды, буферы повтора и движки для распределённого выполнения. Исследователи могут комбинировать компоненты для прототипирования новых алгоритмов, контролировать метрики обучения с помощью встроенного логирования и использовать масштабируемые распределённые пайплайны для масштабных экспериментов. Acme интегрируется с TensorFlow и JAX, поддерживает пользовательские среды через интерфейсы OpenAI Gym и включает утилиты для создания контрольных точек, оценки и настройки гиперпараметров.