aprendizaje por refuerzo

  • AI Hedge Fund 5zu 利用強化學習來自動化投資組合管理並優化交易策略。
    0
    0
    AI Hedge Fund 5zu 是什麼?
    AI Hedge Fund 5zu 提供完整的量化交易流程:可自定義多資產類別模擬環境、基於強化學習的代理模組、回測工具、實時市場數據整合與風險管理工具。用戶可以配置數據來源,定義獎勵函數,使用歷史數據訓練代理,並在重要金融指標上評估性能。此框架支援模組化策略開發,可擴展至實時經紀商 API 用於部署生產級交易機器人。
  • 開源Python工具包,提供隨機、基於規則的圖案識別與強化學習代理,用於石頭剪刀布。
    0
    0
    AI Agents for Rock Paper Scissors 是什麼?
    AI代理人石頭剪刀布是一個開源Python專案,展示如何在經典遊戲中建立、訓練和評估不同的AI策略——隨機、規則基圖案識別與強化學習(Q-學習)。它提供模組化的代理類別、可配置的遊戲執行器、性能記錄與視覺化工具。用戶可以輕鬆交換代理、調整學習參數,並探索AI在競爭場景中的行為。
  • 一個Python OpenAI Gym環境,模擬啤酒遊戲供應鏈,用於訓練和評估RL代理。
    0
    0
    Beer Game Environment 是什麼?
    啤酒遊戲環境提供一個四階段啤酒供應鏈——零售商、批發商、經銷商與製造商的離散時間模擬,並曝光OpenAI Gym介面。代理會收到包括現有庫存、管線庫存和進貨訂單的觀察資訊,然後輸出訂貨量。該環境計算每步的庫存持有和缺貨成本,並支持可定制的需求分布和領先時間。它可與熱門RL庫如Stable Baselines3無縫集成,方便研究人員和教育者在供應鏈優化任務中進行基準測試和訓練。
  • BotPlayers是一個開源框架,支持創建、測試和部署具有強化學習支持的AI遊戲代理。
    0
    0
    BotPlayers 是什麼?
    BotPlayers是一個多功能的開源框架,旨在簡化AI驅動的遊戲代理的開發與部署。它具有支持截屏爬取、Web API或自訂模擬界面的彈性環境抽象層,允許代理與各種遊戲交互。框架內置強化學習算法、遺傳算法和基於規則的啟發式策略,並附有數據記錄、模型檢查點和性能視覺化工具。其模塊化插件系統讓開發者可用Python或Java自訂感測器、行動和AI策略。BotPlayers亦提供YAML配置快速原型開發和自動化訓練、評估流程。支持Windows、Linux和macOS等多平台,加速智能遊戲代理的實驗與商用。
  • 一個開源的強化學習環境,用於最佳化建築能源管理、微電網控制和需求響應策略。
    0
    0
    CityLearn 是什麼?
    CityLearn 提供一個模組化的模擬平台,用於使用強化學習進行能源管理研究。用戶可以定義多區域的建築群、配置 HVAC 系統、儲能單元和可再生能源,然後對 RL 代理進行訓練,應對需求響應事件。這個環境會顯示狀態觀測,例如溫度、負載輪廓和能源價格,而操作則控制設定點和儲存調度。一個彈性的獎勵 API 支援自訂指標,例如節省成本或減少排放,且日誌工具支援性能分析。CityLearn 非常適合用於基準測試、課程學習以及在可重現的研究框架內開發新型控制策略。
  • Open-source framework offering reinforcement learning-based cryptocurrency trading agents with backtesting, live trading integration, and performance tracking.
    0
    0
    CryptoTrader Agents 是什麼?
    CryptoTrader Agents provides a comprehensive toolkit for designing, training, and deploying AI-driven trading strategies in cryptocurrency markets. It includes a modular environment for data ingestion, feature engineering, and custom reward functions. Users can leverage preconfigured reinforcement learning algorithms or integrate their own models. The platform offers simulated backtesting on historical price data, risk management controls, and detailed metric tracking. When ready, agents can connect to live exchange APIs for automated execution. Built on Python, the framework is fully extensible, enabling users to prototype new tactics, run parameter sweeps, and monitor performance in real time.
  • 一個高效能的Python框架,提供快速、模組化的強化學習演算法,支援多環境操作。
    0
    0
    Fast Reinforcement Learning 是什麼?
    Fast Reinforcement Learning是一個專門的Python框架,旨在加速強化學習代理的開發與執行。它支援流行的算法如PPO、A2C、DDPG和SAC,並配合高吞吐量的向量環境管理。用戶可以輕鬆配置策略網絡、自定義訓練流程,並利用GPU加速進行大規模試驗。其模組化設計確保與OpenAI Gym環境的無縫整合,使研究人員和實務工作者能在控制、遊戲和模擬任務中原型設計、基準測試與部署代理。
  • DeepSeek R1 是一個專精於推理、數學及編碼的先進開源 AI 模型。
    0
    0
    Deepseek R1 是什麼?
    DeepSeek R1 代表了人工智慧的一項重大突破,在推理、數學和編碼任务中提供頂尖的性能。它利用擁有 37B 激活參數和 671B 總參數的複雜 MoE(Mixture of Experts)架構,實施先進的強化學習技術,以達到最先進的基準。該模型提供強大的性能,包括在 MATH-500 中達到 97.3% 的準確率和 Codeforces 中的 96.3% 百分位排名。其開源特性及具成本效益的部署選項,使其可用於各種應用。
  • 基於Python的RL框架,實現深度Q-learning,用於訓練AI代理玩Chrome的離線恐龍遊戲。
    0
    0
    Dino Reinforcement Learning 是什麼?
    Dino Reinforcement Learning提供一整套工具,用於訓練AI代理通過強化學習遊玩Chrome恐龍遊戲。通過與Selenium的無頭Chrome實例集成,它捕捉實時遊戲畫面並將其處理為優化深度Q網路輸入的狀態表示。該框架包括重播記憶體、epsilon-greedy探索、卷積神經網路模型以及可定制超參數的訓練循環。用戶可以通過控制台日誌監控訓練進展,並保存檢查點以供後續評估。訓練完成後,代理可以自動自主應用或與不同模型架構進行基準測試。模組化設計使得更換RL算法變得簡單,是一個彈性良好的實驗平台。
  • 基於TensorFlow的開源Deep Q-Network代理,利用經驗回放和目標網路學習玩Atari Breakout。
    0
    0
    DQN-Deep-Q-Network-Atari-Breakout-TensorFlow 是什麼?
    DQN-深度Q網絡-Atari-Breakout-TensorFlow提供了專為Atari Breakout環境定制的完整DQN算法實現。它采用卷積神經網絡來逼近Q值,使用經驗回放打破序列觀察之間的相關性,並採用定期更新的目標網路來穩定訓練。代理遵循epsilon-greedy策略進行探索,並可以從原始像素輸入從零開始訓練。存儲庫包括配置文件、用於監控獎勵增長的訓練腳本、測試訓練模型的評估腳本,以及TensorBoard工具用於可視化訓練指標。用戶可以調整超參數(如學習率、回放緩衝器大小和批次大小)來實驗不同設定。
  • 用於多智能體系統的開源PyTorch框架,以學習和分析合作強化學習任務中的新興通訊協議。
    0
    0
    Emergent Communication in Agents 是什麼?
    智能體中的新興通訊是一個開源的PyTorch框架,專為探索多智能體系統如何發展自己的通訊協議的研究人員設計。該資料庫提供靈活的合作強化學習任務實現,包括參照游戲、組合彩游戲和對象識別挑戰。用戶定義說話者和聽者的架構,指定訊息通道的屬性(如詞匯大小和序列長度),並選擇訓練策略(如策略梯度或監督學習)。框架包括端到端的腳本用於執行實驗、分析通訊效率和可視化新興語言。其模組化設計允許輕鬆擴展新的游戲環境或自定義損失函數。研究人員可以復現已發表的研究、基準測試新算法,並探究新興智能體語言的組合性和語意。
  • Gym-Recsys 提供可自訂的 OpenAI Gym 環境,用於擴展性訓練與評估強化學習推薦代理人
    0
    0
    Gym-Recsys 是什麼?
    Gym-Recsys 是一個工具箱,將推薦任務封裝成 OpenAI Gym 環境,使強化學習演算法能逐步與模擬的用戶-項目矩陣互動。它提供合成用戶行為產生器、支援載入流行資料集,並提供如 Precision@K 和 NDCG 等標準推薦評測指標。用戶可以自訂獎勵函數、用戶模型和項目池,用以實驗不同的 RL 基礎推薦策略,並具有可重現性。
  • 一個與OpenAI Gym相容的可自訂格子世界環境合集,用於強化學習演算法的開發與測試。
    0
    0
    GridWorldEnvs 是什麼?
    GridWorldEnvs提供一個完整的格子世界環境套件,支援設計、測試與Benchmark多智能體系統。用戶可輕鬆配置格子尺寸、代理起始位置、目標位置、障礙物、獎勵結構與動作空間。內建範例模版包括經典格子導航、避障與合作任務,也允許用JSON或Python類別定義自訂場景。與OpenAI Gym API無縫整合,支援直接應用標準RL演算法。同時支援單一與多智能體實驗、記錄與視覺化工具,用於跟蹤代理績效。
  • gym-fx 提供一個可自訂的 OpenAI Gym 環境,用於訓練和評估強化學習代理,以進行外匯交易策略。
    0
    0
    gym-fx 是什麼?
    gym-fx 是一個開源的 Python 函式庫,利用 OpenAI Gym 介面實作模擬外匯交易環境。它支援多貨幣對,整合歷史價格資料、技術指標,並提供完全可自訂的獎勵函數。藉由提供一個標準化的 API,gym-fx 簡化了為演算法交易進行基準測試和發展的流程。用戶可以配置市場滑點、交易成本以及觀察空間,以逼真模擬實盤交易情況,促進策略的開發與評估。
  • gym-llm 提供類似 gym 的環境,供基準測試和訓練大型語言模型(LLM)代理,適用於對話式與決策任務。
    0
    0
    gym-llm 是什麼?
    gym-llm 擴展了 OpenAI Gym 生態系統,定義文本環境,讓 LLM 代理透過提示與動作互動。每個環境遵循 Gym 的步驟、重置與渲染慣例,輸出文本觀察並接受模型產生的回應作為動作。開發者可指定提示範例、獎勵計算與終止條件,打造複雜的決策與對話基準。整合流行的 RL 函式庫、日誌工具與可配置的評估指標,促進端到端的實驗。不論是評估 LLM 解謎、管理對話或導航結構化任務,gym-llm 提供標準化、可複現的研究與進階語言代理開發框架。
  • 一個基於Python的OpenAI Gym環境,提供可自定義的多房間網格世界,用於強化學習代理的導航和探索研究。
    0
    0
    gym-multigrid 是什麼?
    gym-multigrid提供一套可定製的網格世界環境,旨在用於強化學習中的多房間導航和探索任務。每個環境由相互連接的房間組成,內有物體、鑰匙、門和障礙物。用戶可以程式設計調整網格大小、房間配置和物體佈局。該庫支持全觀測或部分觀測模式,提供RGB或矩陣狀態表示。行動包括移動、物體交互和門的操作。將其作為Gym環境整合後,研究人員可以利用任何兼容Gym的代理,無縫訓練和評估用於鑰匙門拼圖、物體檢索和層次規劃等任務的演算法。gym-multigrid的模組化設計與最小依賴,使其成為新AI策略基準測試的理想選擇。
  • HFO_DQN是一個強化學習框架,應用Deep Q-Network來訓練RoboCup半場進攻環境中的足球代理人。
    0
    0
    HFO_DQN 是什麼?
    HFO_DQN結合了Python和TensorFlow,提供用於訓練使用Deep Q-Network足球代理人的完整流程。用戶可以克隆存儲庫、安裝依賴項(包括HFO模擬器和Python庫),並在YAML文件中配置訓練參數。該框架實現了經驗重放、目標網路更新、ε-貪婪探索和針對半場進攻領域的獎勵塑造。它包含訓練代理人、性能記錄、評估比賽和結果繪圖的腳本。模塊化結構允許集成自定義神經網絡架構、替代強化學習算法和多智能體協調策略。輸出包括訓練模型、性能指標和行為視覺化,促進強化學習和多智能體系統研究。
  • Jason-RL為Jason BDI代理器配備強化學習,透過獎勵經驗實現基於Q-learning和SARSA的自適應決策。
    0
    0
    jason-RL 是什麼?
    Jason-RL在Jason多代理框架中加入一層強化學習,使AgentSpeak BDI代理器可以通過獎勵反饋學習行動選擇策略。它實現了Q-learning和SARSA算法,支援配置學習參數(學習率、折扣因子、探索策略)並記錄訓練指標。通過在代理計劃中定義獎勵函數和運行模擬,開發者可以觀察代理隨時間改善決策,並適應變化的環境,而不需要手動編碼策略。
  • MARFT是一個開源的多代理強化學習(RL)微調工具包,用於協作AI工作流程和語言模型優化。
    0
    0
    MARFT 是什麼?
    MARFT是一個基於Python的LLM,支持可重複實驗和快速原型設計協作式AI系統。
  • 一個開源的受Minecraft啟發的強化學習平台,讓AI代理在可定製的3D沙盒環境中學習複雜任務。
    0
    0
    MineLand 是什麼?
    MineLand提供一個受到Minecraft啟發的彈性3D沙盒環境,用於訓練強化學習代理。它具有Gym相容的API,可與Stable Baselines、RLlib及自訂實作的RL庫無縫整合。用戶可存取資源收集、導航及建設挑戰等任務庫,每個任務皆可自訂難度與獎勵結構。即時渲染、多代理情境及無界面模式支援可擴展的訓練與基準測試。開發者可設計新地圖、定義自訂獎勵函數,以及加入感測器或控制元件。MineLand的開源程式碼促進重現研究、協作開發與在複雜虛擬世界中快速原型設計AI代理。
精選
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
VoxDeck
引領視覺革命的AI簡報製作工具
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
Seedance 2 AI
結合影像、影片、音訊與文字的多模態 AI 影片生成器,可創作具電影感的短片。
LTX-2 AI
開源的 LTX-2 能從文字或圖片提示快速生成具原生音頻同步的 4K 影片,且已具備生產就緒能力。
FalcoCut
FalcoCut:基於網頁的 AI 平台,用於影片翻譯、虛擬人影片、語音複製、換臉與短影片生成。
SOLM8
你可以呼叫並與之聊天的 AI 女友。真實語音對話並具備記憶。每一刻與她相處都特別。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。
Vertech Academy
Vertech 提供旨在幫助學生和教師有效學習與教學的人工智慧提示。
Seedance-2
Seedance 2.0 是一款免費的 AI 驅動文字轉影片與圖片轉影片生成器,具有逼真的口型對齊和音效。
Van Gogh Free Video Generator
一款由 AI 驅動的免費影片生成器,可輕鬆從文字和圖片創建令人驚豔的影片。

直覺操作的aprendizaje por refuerzo工具

快速掌握並使用aprendizaje por refuerzo工具,不論新手或專業人士,都能享受流暢的操作體驗。