

Herramientas fonctions de récompense personnalisées de alto rendimiento

Accede a soluciones fonctions de récompense personnalisées que te ayudarán a completar tareas complejas con facilidad.

fonctions de récompense personnalisées

Gym-Recsys
Gym-Recsys proporciona entornos OpenAI Gym personalizables para entrenamiento y evaluación escalable de agentes de recomendación mediante aprendizaje por refuerzo

0


0
Visitar IA
¿Qué es Gym-Recsys?
Gym-Recsys es una caja de herramientas que envuelve tareas de recomendación en entornos OpenAI Gym, permitiendo que algoritmos de aprendizaje por refuerzo interactúen paso a paso con matrices de usuario-ítem simuladas. Proporciona generadores de comportamiento de usuario sintético, soporta cargar conjuntos de datos populares y entrega métricas estándar como Precision@K y NDCG. Los usuarios pueden personalizar funciones de recompensa, modelos de usuario y pools de ítems para experimentar con diferentes estrategias de recomendación basadas en RL de manera reproducible.
Características principales de Gym-Recsys
gym-fx
gym-fx proporciona un entorno OpenAI Gym personalizable para entrenar y evaluar agentes de aprendizaje por refuerzo en estrategias de trading en Forex.

0


0
Visitar IA
¿Qué es gym-fx?
gym-fx es una biblioteca de Python de código abierto que implementa un entorno simulado de trading en Forex usando la interfaz OpenAI Gym. Ofrece soporte para múltiples pares de divisas, integración de flujos de precios históricos, indicadores técnicos y funciones de recompensa completamente personalizables. Al proporcionar una API estandarizada, gym-fx simplifica el benchmarking y el desarrollo de algoritmos de aprendizaje por refuerzo para trading algorítmico. Los usuarios pueden configurar el deslizamiento de mercado, costos de transacción y espacios de observación para imitar de cerca escenarios de trading en vivo, facilitando el desarrollo y evaluación de estrategias robustas.
Características principales de gym-fx
Multi-Agent Surveillance
Entorno Python de código abierto para entrenar agentes IA cooperativos para vigilar y detectar intrusos en escenarios basados en una cuadrícula.

0


0
Visitar IA
¿Qué es Multi-Agent Surveillance?
Multi-Agent Surveillance ofrece un marco de simulación flexible donde múltiples agentes IA actúan como depredadores o evasores en un mundo de cuadrícula discreto. Los usuarios pueden configurar parámetros del entorno como dimensiones de la cuadrícula, número de agentes, radios de detección y estructuras de recompensa. El repositorio incluye clases en Python para comportamiento de agentes, scripts de generación de escenarios, visualización incorporada mediante matplotlib y una integración fluida con bibliotecas populares de aprendizaje por refuerzo. Esto facilita la creación de referencias para la coordinación multi-agente, desarrollo de estrategias de vigilancia personalizadas y realización de experimentos reproducibles.
Características principales de Multi-Agent Surveillance
Multi-Agent DDPG with PyTorch & Unity ML-Agents
Implementa aprendizaje por refuerzo multi-agente DDPG descentralizado usando PyTorch y Unity ML-Agents para entrenamiento colaborativo de agentes.

0


0
Visitar IA
¿Qué es Multi-Agent DDPG with PyTorch & Unity ML-Agents?
Este proyecto de código abierto brinda un marco completo de aprendizaje por refuerzo multi-agente construido sobre PyTorch y Unity ML-Agents. Incluye algoritmos DDPG descentralizados, envoltorios de entornos y scripts de entrenamiento. Los usuarios pueden configurar políticas de agentes, redes críticas, buffers de reproducción y trabajadores de entrenamiento en paralelo. Los hooks de registro permiten monitoreo con TensorBoard, mientras que una estructura modular soporta funciones de recompensa y parámetros de entorno personalizables. El repositorio incluye escenas de ejemplo en Unity demostrando tareas de navegación colaborativa, ideal para ampliar y evaluar escenarios multi-agente en simulaciones.
Características principales de Multi-Agent DDPG with PyTorch & Unity ML-Agents
StarCraft II Reinforcement Learning Agent
Un agente de aprendizaje por refuerzo de código abierto que utiliza PPO para entrenar y jugar StarCraft II a través del entorno PySC2 de DeepMind.

0


0
Visitar IA
¿Qué es StarCraft II Reinforcement Learning Agent?
Este repositorio proporciona un marco completo para la investigación en juego en StarCraft II. El agente principal usa Proximal Policy Optimization (PPO) para aprender redes de política que interpretan datos de observación del entorno PySC2 y generan acciones precisas en el juego. Los desarrolladores pueden configurar capas de redes neuronales, formateo de recompensas y horarios de entrenamiento para optimizar el rendimiento. El sistema soporta multiproceso para recolección eficiente de muestras, utilidades de registro para monitorear curvas de entrenamiento y scripts de evaluación para correr políticas entrenadas contra oponentes scriptados o AI incorporados. El código está escrito en Python y aprovecha TensorFlow para definición y optimización de modelos. Los usuarios pueden extender componentes como funciones de recompensa personalizadas, preprocesamiento de estado o arquitecturas de red para fines específicos de investigación.
Características principales de StarCraft II Reinforcement Learning Agent



Destacados

Herramientas fonctions de récompense personnalisées de alto rendimiento

Accede a soluciones fonctions de récompense personnalisées que te ayudarán a completar tareas complejas con facilidad.

fonctions de récompense personnalisées

Gym-Recsys

gym-fx

Multi-Agent Surveillance

Multi-Agent DDPG with PyTorch & Unity ML-Agents

StarCraft II Reinforcement Learning Agent