Мощные 学習パラメーター инструменты

Спонсируется BGRemover - Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.



BGRemover - Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.





Новости ИИ

Войти

学習パラメーター

jason-RL
Jason-RL оснащает агенты Jason BDI алгоритмами обучения с подкреплением, обеспечивая адаптивное принятие решений на основе Q-обучения и SARSA с помощью опыта получения наград.

0


0
Посетить ИИ
Что такое jason-RL?
Jason-RL добавляет слой обучения с подкреплением в многопользовательскую систему Jason, позволяя агентам AgentSpeak BDI изучать политики выбора действий по наградной обратной связи. Реализует алгоритмы Q-обучения и SARSA, поддерживает настройку параметров обучения (скорость обучения, коэффициент дисконтирования, стратегию исследования) и регистрирует метрики тренировки. Определяя функции наград в планах агентов и запуская симуляции, разработчики могут наблюдать за улучшением решений агентов со временем и их адаптацией к меняющимся условиям без ручного кодирования политик.
Основные функции jason-RL

Интеграция Q-обучения

Интеграция SARSA

Настраиваемые параметры обучения

Поддержка функций наград

Логирование метрик тренировки



Рекомендуемые

学習パラメーター

jason-RL