Pacman AI предлагает полностью функциональную среду на Python и платформу для агентов для классической игры Pacman. Проект реализует основные алгоритмы обучения с подкреплением—Q-обучение и итерацию ценностей—для обучения агентов оптимальным политикам сбора пилюль, навигации по лабиринту и избегания призраков. Пользователи могут задавать собственные функции наград и настраивать гиперпараметры, такие как скорость обучения, коэффициент дисконтирования и стратегию исследования. Эта платформа поддерживает ведение метрик, визуализацию производительности и воспроизводимость экспериментов. Спроектирована для легкой расширяемости, что позволяет исследователям и студентам внедрять новые алгоритмы или нейросетевые подходы и сравнивать их с базовыми методами на сетке в области Pacman.