navegación de laberintos

Pacman AI
Открытый агент обучения с подкреплением, который учится играть в Pacman, оптимизируя стратегии навигации и избегания призраков.

0


0
Посетить ИИ
Что такое Pacman AI?
Pacman AI предлагает полностью функциональную среду на Python и платформу для агентов для классической игры Pacman. Проект реализует основные алгоритмы обучения с подкреплением—Q-обучение и итерацию ценностей—для обучения агентов оптимальным политикам сбора пилюль, навигации по лабиринту и избегания призраков. Пользователи могут задавать собственные функции наград и настраивать гиперпараметры, такие как скорость обучения, коэффициент дисконтирования и стратегию исследования. Эта платформа поддерживает ведение метрик, визуализацию производительности и воспроизводимость экспериментов. Спроектирована для легкой расширяемости, что позволяет исследователям и студентам внедрять новые алгоритмы или нейросетевые подходы и сравнивать их с базовыми методами на сетке в области Pacman.
Основные функции Pacman AI

Реализация алгоритма Q-обучения

Агент итерации ценностей

Настраиваемые функции наград

Симуляция окружения для Pacman

Логирование и визуализация производительности

Модульный код для легкого расширения
LLM Maze Agent
Открытая платформа на Python, использующая цепочки рассуждений для динамического решения лабиринтов с помощью LLM-группового планирования.

0


0
Посетить ИИ
Что такое LLM Maze Agent?
Фреймворк LLM Maze Agent предоставляет среду на Python для создания умных агентов, умеющих ориентироваться в сеточных лабиринтах с помощью больших языковых моделей. Совмещая модульные интерфейсы окружения с шаблонами подсказок цепочки расуждений и эвристическим планированием, агент по этапам запрашивает данные у LLM для определения направления движения, адаптации к препятствиям и обновления внутреннего состояния. Поддержка моделей OpenAI и Hugging Face с «из коробки» обеспечивает беспрепятственную интеграцию, а конфигурируемая генерация лабиринтов и пошаговая отладка позволяют экспериментировать с разными стратегиями. Исследователи могут настраивать функции вознаграждения, определять собственные пространства наблюдений и визуализировать маршруты агента для анализа процессов рассуждения. Эта архитектура делает LLM Maze Agent универсальным инструментом для оценки планирования с использованием LLM, обучения концепциям ИИ и бенчмаркинга модели на задачах пространственного рассуждения.
Основные функции LLM Maze Agent