Этот буткемп охватывает весь фреймворк LangChain, позволяя создавать AI-агентов на Python. Вы исследуете шаблоны подсказок, составление цепей, инструменты агентов, память диалогов и поиск по документам. Через интерактивные блокноты и подробные упражнения вы реализуете чатботов, автоматизированные рабочие процессы, системы вопросов и ответов, а также настраиваемые цепочки агентов. По окончании курса вы научитесь развертывать и оптимизировать LangChain-агентов для различных задач.
Основные функции LangChain with Python Bootcamp
Создание и управление шаблонами подсказок
Композиция цепей для многопроходных рабочих процессов
Интеграция инструментов агентов (API, базы данных, поиск)
Что такое StarCraft II Reinforcement Learning Agent?
Данный репозиторий предоставляет полноценную рамочную платформу для исследований в области обучения с подкреплением в игре StarCraft II. Основной агент использует Proximal Policy Optimization (PPO) для обучения сетей политики, интерпретирующих данные наблюдений из среды PySC2 и выдающих точные действия в игре. Разработчики могут настраивать слои нейронных сетей, формирование вознаграждений и графики обучения для оптимизации производительности. Система поддерживает многопоточность для эффективного сбора образцов, утилиты логирования для мониторинга кривых обучения и скрипты оценки для тестирования обученных моделей против скриптованных или встроенных ИИ-оппонентов. Код написан на Python и использует TensorFlow для определения и оптимизации моделей. Пользователи могут расширять компоненты, такие как пользовательские функции вознаграждения, предварительная обработка состояния или архитектура сети, для достижения конкретных целей исследования.
Основные функции StarCraft II Reinforcement Learning Agent