Ferramentas epsilon-貪婪策略 para todas as ocasiões

Obtenha soluções epsilon-貪婪策略 flexíveis que atendem a diversas demandas com eficiência.

epsilon-貪婪策略

  • Agente de Deep Q-Network baseado em TensorFlow de código aberto que aprende a jogar Atari Breakout usando replay de experiência e redes alvo.
    0
    0
    O que é DQN-Deep-Q-Network-Atari-Breakout-TensorFlow?
    DQN-Deep-Q-Network-Atari-Breakout-TensorFlow fornece uma implementação completa do algoritmo DQN adaptado ao ambiente Atari Breakout. Utiliza uma rede neural convolucional para aproximar valores Q, aplica replay de experiências para quebrar correlações entre observações sequenciais e emprega uma rede alvo atualizada periodicamente para estabilizar o treinamento. O agente segue uma política epsilon-greedy para exploração e pode ser treinado do zero com entrada de pixels crus. O repositório inclui arquivos de configuração, scripts de treinamento para monitorar o crescimento da recompensa por episódios, scripts de avaliação para testar modelos treinados e utilitários TensorBoard para visualizar métricas de treinamento. Os usuários podem ajustar hiperparâmetros como taxa de aprendizagem, tamanho do buffer de replay e tamanho do lote para experimentar diferentes configurações.
Em Destaque