Python para IA

Dino Reinforcement Learning
Рамки для обучения с подкреплением на базе Python, реализующие deep Q-learning для обучения AI-агента игре офлайн-динозавра Chrome.

0


0
Посетить ИИ
Что такое Dino Reinforcement Learning?
Dino Reinforcement Learning — это полный набор инструментов для обучения AI-агента играть в игру динозавров Chrome с помощью обучения с подкреплением. Интеграция с безголовым Chrome через Selenium обеспечивает захват игровых кадров в реальном времени и их обработку в представления состояний, оптимизированные для входных данных глубоких Q-сетей. В рамках реализованы модули памяти воспроизведения, эвристического исследования epsilon-greedy, моделей сверточных нейронных сетей и циклов обучения с настраиваемыми гиперпараметрами. Пользователи могут отслеживать прогресс обучения через консольные логи и сохранять контрольные точки для последующей оценки. После обучения агент может быть запущен для автономной игры или протестирован против различных архитектур моделей. Модульный дизайн облегчает замену алгоритмов RL, что делает платформу гибкой для экспериментов.
Основные функции Dino Reinforcement Learning
LangChain with Python Bootcamp
Практический буткемп, обучающий разработчиков созданию AI-агентов с помощью LangChain и Python через практические лабораторные работы.

0


0
Посетить ИИ
Что такое LangChain with Python Bootcamp?
Этот буткемп охватывает весь фреймворк LangChain, позволяя создавать AI-агентов на Python. Вы исследуете шаблоны подсказок, составление цепей, инструменты агентов, память диалогов и поиск по документам. Через интерактивные блокноты и подробные упражнения вы реализуете чатботов, автоматизированные рабочие процессы, системы вопросов и ответов, а также настраиваемые цепочки агентов. По окончании курса вы научитесь развертывать и оптимизировать LangChain-агентов для различных задач.
Основные функции LangChain with Python Bootcamp
mini-agi
Легкий фреймворк на Python, позволяющий автономным ИИ-агентам планировать, создавать задачи и извлекать информацию через API OpenAI.

0


0
Посетить ИИ
Что такое mini-agi?
mini-agi разработан, чтобы упростить создание автономных ИИ-агентов, предоставляя минимальный и модульный каркас. Написанный на Python, он использует языковые модели OpenAI для интерпретации высокоуровневых целей, разложения их на подзадачи и оркестрации вызовов инструментов, таких как HTTP-запросы, операции с файлами или пользовательские действия. В рамках фреймворка реализовано хранилище памяти для отслеживания состояния агента и результатов, модуль планирования для разбиения задач с использованием эвристик на основе стоимости, и модуль исполнения, который последовательно вызывает инструменты. С помощью конфигурационных файлов пользователи могут вставлять собственные инструменты, определять шаблоны подсказок и регулировать глубину планирования. Легкая архитектура mini-agi делает его идеальным для прототипирования ИИ-агентов, выполняющих исследовательские запросы, автоматизирующих рабочие процессы или автономно генерирующих код.
Основные функции mini-agi
StarCraft II Reinforcement Learning Agent
Открытый агент обучения с подкреплением, использующий PPO для обучения и игры в StarCraft II через среду PySC2 от DeepMind.

0


0
Посетить ИИ
Что такое StarCraft II Reinforcement Learning Agent?
Данный репозиторий предоставляет полноценную рамочную платформу для исследований в области обучения с подкреплением в игре StarCraft II. Основной агент использует Proximal Policy Optimization (PPO) для обучения сетей политики, интерпретирующих данные наблюдений из среды PySC2 и выдающих точные действия в игре. Разработчики могут настраивать слои нейронных сетей, формирование вознаграждений и графики обучения для оптимизации производительности. Система поддерживает многопоточность для эффективного сбора образцов, утилиты логирования для мониторинга кривых обучения и скрипты оценки для тестирования обученных моделей против скриптованных или встроенных ИИ-оппонентов. Код написан на Python и использует TensorFlow для определения и оптимизации моделей. Пользователи могут расширять компоненты, такие как пользовательские функции вознаграждения, предварительная обработка состояния или архитектура сети, для достижения конкретных целей исследования.
Основные функции StarCraft II Reinforcement Learning Agent