Решения 價值迭代 для эффективности

Откройте надежные и мощные 價值迭代 инструменты, которые обеспечивают высокую производительность.

價值迭代

  • Открытый агент обучения с подкреплением, который учится играть в Pacman, оптимизируя стратегии навигации и избегания призраков.
    0
    0
    Что такое Pacman AI?
    Pacman AI предлагает полностью функциональную среду на Python и платформу для агентов для классической игры Pacman. Проект реализует основные алгоритмы обучения с подкреплением—Q-обучение и итерацию ценностей—для обучения агентов оптимальным политикам сбора пилюль, навигации по лабиринту и избегания призраков. Пользователи могут задавать собственные функции наград и настраивать гиперпараметры, такие как скорость обучения, коэффициент дисконтирования и стратегию исследования. Эта платформа поддерживает ведение метрик, визуализацию производительности и воспроизводимость экспериментов. Спроектирована для легкой расширяемости, что позволяет исследователям и студентам внедрять новые алгоритмы или нейросетевые подходы и сравнивать их с базовыми методами на сетке в области Pacman.
Рекомендуемые