강화 학습

  • 一個輕量級的Python庫,用於創建可定製的2D網格環境,以訓練和測試增強學習代理人。
    0
    0
    Simple Playgrounds 是什麼?
    Simple Playgrounds提供一個模塊化的平台,用於建立交互式的2D網格環境,代理人在其中可以導航迷宮、與物件互動並完成任務。用戶可以通過簡單的YAML或Python腳本來定義環境佈局、物體行為和獎勵函數。內建的Pygame渲染器提供實時可視化,且基於步驟的API確保與Stable Baselines3等RL庫的無縫集成。支援多代理、多碰撞偵測及可自訂的物理參數,Simple Playgrounds讓原型設計、基準測試與教育演示算法變得更便利。
  • 開源PyTorch庫,提供模組化的強化學習代理實現,如DQN、PPO、SAC等。
    0
    0
    RL-Agents 是什麼?
    RL-Agents是一個基於PyTorch建構的研究級強化學習框架,整合了基於價值、策略及演員-評論員方法的流行RL算法。庫中具有模組化代理API、GPU加速、與OpenAI Gym的無縫整合,以及內建的記錄和視覺化工具。用戶可以調整超參數、客製化訓練流程,並用少量程式碼進行性能測試,適合學術研究、原型開發與工業實驗。
  • 一個增強學習框架,使自主機器人在多智能體環境中導航並避免碰撞。
    0
    0
    RL Collision Avoidance 是什麼?
    RL Collision Avoidance 提供完整的流程,用於開發、訓練和部署多機器人碰撞避免策略。它提供一套與 Gym 相容的模擬情境,在這些情境中代理人透過增強學習算法學習無碰撞的導航。使用者可以自訂環境參數,利用 GPU 加速以加快訓練速度,並導出學習到的策略。該框架還與 ROS 整合,用於實地測試,支援預訓練模型以立即進行評估,以及提供可視化代理人軌跡與性能指標的工具。
  • 簡易自學是一個Python庫,提供簡單的API來建立、訓練和評估強化學習代理。
    0
    0
    dead-simple-self-learning 是什麼?
    簡易自學為開發者提供一個非常簡單的方法來用Python建立和訓練強化學習代理。該框架將核心RL組件(如環境封裝、策略模組和經驗緩衝)封裝為簡潔接口。用戶能快速初始化環境,使用熟悉的PyTorch或TensorFlow後端定義自訂策略,並執行內建有日誌記錄和檢查點的訓練循環。該庫支持on-policy和off-policy演算法,可靈活進行Q學習、策略梯度和演員-評論家方法的試驗。降低樣板碼重複度,使實務者、教師和研究人員能以最少配置快速原型化演算法、測試假設並視覺化代理性能。其模組化設計也便於與現有ML堆疊和自訂環境整合。
  • SoccerAgent 使用多代理增强学习來訓練 AI 球員,以實現逼真的足球模擬和策略優化。
    0
    0
    SoccerAgent 是什麼?
    SoccerAgent 是一個專門用於開發和訓練自主足球代理的 AI 框架,採用最先进的多代理增強學習(MARL)技術。它在 2D 或 3D 環境中模擬逼真的足球比賽,提供定義獎勵函數、定制玩家屬性和實施戰術策略的工具。用戶可以通過內建模塊整合流行的 RL 算法(如 PPO、DDPG 和 MADDPG),通過儀表板監控訓練進度,以及實時視覺化代理行為。此框架支持基於場景的訓練,涵蓋進攻、防守與協作協議。具有擴展性強的代碼庫和詳細文檔,SoccerAgent 使研究人員和開發者能夠分析團隊動態,並優化基於 AI 的比賽策略,應用於學術和商業項目。
  • 一個開源的增強學習代理,利用PPO在DeepMind的PySC2環境中訓練並玩星際爭霸II。
    0
    0
    StarCraft II Reinforcement Learning Agent 是什麼?
    此存儲庫提供一個完整的星際爭霸II遊戲研究增強學習框架。核心代理使用PPO來學習策略網絡,詮釋來自PySC2環境的觀察數據,並輸出精確的遊戲內動作。開發者可以配置神經網絡層、獎勵塑造與訓練計劃,以優化性能。系統支持多處理技術以高效收集樣本,並包含監控訓練曲線的日誌工具與測試已訓練策略的評估腳本(對完成或內建的AI對手)。程式碼以Python撰寫,利用TensorFlow進行模型定義與優化。用戶可以擴展自定義獎勵函數、狀態前處理或網路架構,以符合特定研究需求。
  • 基於強化學習的AI代理,學習最佳投注策略,以高效玩轉對戰限制德州撲克。
    0
    0
    TexasHoldemAgent 是什麼?
    TexasHoldemAgent提供一個基於Python的模組化環境,用於訓練、評估和部署由AI驅動的對戰限制德州撲克角色。它整合了自定義模擬引擎與深度強化學習算法(如DQN),用於反覆策略改進。主要功能包括手牌狀態編碼、行動空間定義(棄牌、跟注、加注)、獎勵塑造和即時決策評估。用戶可自訂學習參數、利用CPU/GPU加速、監控訓練進度,並載入或儲存訓練模型。該框架支援批次模擬,測試策略、產生性能數據及視覺化勝率,幫助研究者、開發者和撲克愛好者實驗AI驅動的遊玩策略。
  • Text-to-Reward 從自然語言指令學習通用的回饋模型,以有效引導強化學習代理。
    0
    0
    Text-to-Reward 是什麼?
    Text-to-Reward 提供一個流程,用於訓練能將文字描述或反饋映射為數值回饋的模型,供 RL 代理使用。它利用基於轉換器的架構並在收集的人類偏好數據上進行微調,自動學習如何將自然語言指令解讀為回饋信號。用戶可以用文字提示定義任意任務,訓練模型,再將學習到的回饋函數整合到任何 RL 演算法中。此方法消除手動設計回饋的需求,提高樣本效率,並讓代理能在模擬或現實環境中執行複雜的多步指令。
  • uAgents 提供一個模組化框架,用於構建具有點對點通信、協作和學習能力的去中心化自主AI代理。
    0
    0
    uAgents 是什麼?
    uAgents 是一個模組化的 JavaScript 框架,讓開發者能建構具備自主性、去中心化的AI代理,這些代理可以發現其他點對點、交換訊息、協作任務,並進行學習適應。代理透過 libp2p 群播協議通信,使用鏈上登記檔註冊能力,並利用智能合約協商服務層協議。核心庫管理代理的生命周期事件、訊息路由以及如強化學習和市場導向任務分配等可擴展的行為。藉由客製化插件,uAgents可整合 Fetch.ai 的帳本、外部API和預言機網絡,使代理能執行現實世界動作、數據採集與決策,並在無中心管理的分散環境中運作。
  • Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
    0
    0
    Vanilla Agents 是什麼?
    Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
  • VMAS是一個模塊化的多智能體強化學習框架,具有內置算法,可實現GPU加速的多智能體環境仿真與訓練。
    0
    0
    VMAS 是什麼?
    VMAS是一個構建與訓練多智能體系統的綜合工具包,利用深度強化學習。它支持GPU並行模擬上百個環境實例,實現高通量數據收集與可擴展訓練。VMAS包含流行的MARL算法實現,例如PPO、MADDPG、QMIX和COMA,並具有模塊化的策略和環境接口,便於快速原型設計。該框架促進集中訓練與去中心化執行(CDTE),提供可自定義的獎勵塑造、觀測空間和回調鉤子,用於記錄和可視化。其模塊化設計使VMAS能與PyTorch模型及外部環境無縫整合,非常適合在機器人、交通控制、資源分配和遊戲AI等多方面進行合作、競爭與混合動機任務的研究。
  • 一個用於遊戲王對戰的開源強化學習代理,提供環境模擬、策略訓練和策略優化。
    0
    0
    YGO-Agent 是什麼?
    YGO-Agent框架允許研究人員與愛好者利用強化學習開發能玩遊戲王卡牌遊戲的AI機器人。它將YGOPRO遊戲模擬器包裝成與OpenAI Gym相容的環境,定義手牌、場地和生命值等狀態表示,並包括召喚、魔法/陷阱啟動和攻擊等行動。獎勵基於勝負結果、造成的傷害和遊戲進展。代理架構使用PyTorch實作DQN,並提供客製化網絡架構、經驗回放及epsilon-greedy探索選擇。記錄模組可以記載訓練曲線、勝率與詳細行動日誌供分析。此框架為模組化設計,允許用戶替換或擴充獎勵函數或行動空間等元件。
  • A-Mem為AI代理提供一個記憶模組,支援情境性、短期及長期記憶的儲存與取用。
    0
    0
    A-Mem 是什麼?
    A-Mem設計用於無縫整合Python為基礎的AI代理框架,提供三大不同的記憶模組:每集上下文的情境記憶、即時過去行動的短期記憶,以及隨時間累積知識的長期記憶。開發者可以自訂記憶容量、保留策略與序列化儲存後端,如記憶體或Redis。此函式庫包含高效的索引演算法,用於根據相似度及上下文窗伍來檢索相關記憶。將A-Mem的記憶處理器插入代理的感知-行動循環中,使用者可在運行時儲存觀察、行動與結果,並查詢過去經驗來輔助當前決策。其模組化設計便於在強化學習、對話AI、機器人導航等任務中快速實驗,這些任務需具備情境感知與時間推理能力。
  • 將X-Plane飛行模擬器與OpenAI Gym連接,用於訓練增強學習代理,以實現逼真的飛機控制,使用Python實現。
    0
    0
    GYM_XPLANE_ML 是什麼?
    GYM_XPLANE_ML將X-Plane飛行模擬器封裝為一個OpenAI Gym環境,將油門、升降舵、副翼舵和方向舵作為行動空間,將高度、速度和姿態等飛行參數作為觀察信息。用戶可以在Python中編寫訓練流程,選擇預設場景或自訂航點、天氣條件及飛機模型。此庫能處理與X-Plane的低延遲通信,以同步模式運行訓練、記錄性能指標,並支援即時渲染以便除錯。它支持基於ML的自主飛控系統的反覆開發,以及在高保真模擬環境中測試RL算法。
  • Acme 是一個模組化的強化學習框架,提供可重用的代理元件和高效的分散式訓練流程。
    0
    0
    Acme 是什麼?
    Acme 是一個基於 Python 的框架,簡化了增強學習代理的開發與評估。它提供預先建立的代理實現(例如 DQN、PPO、SAC)、環境封裝、重播緩衝區以及分散式執行引擎。研究人員可以混合搭配元件,原型設計新算法,通過內建日誌監控訓練指標,並利用擴展式分散式流程進行大規模實驗。Acme 與 TensorFlow 和 JAX 整合,支援透過 OpenAI Gym 接口的自定義環境,並包含快照、評估和超參數配置的工具。
  • 一個人工智慧代理框架,協調多個翻譯代理,共同生成、調整與評估機器翻譯。
    0
    0
    AI-Agentic Machine Translation 是什麼?
    人工智慧代理機器翻譯是一個開源框架,設計用於機器翻譯的研究與開發。它協調三個核心代理:生成、評估與調整,共同產出、評估並改善翻譯。基於PyTorch與Transformer模型,支援監督預訓練、強化學習優化與可配置代理策略。用戶可以在標準資料集上做基準測試、追蹤BLEU分數,並擴充流程加入自訂代理或獎勵函數,以探索代理間合作在翻譯任務中的應用。
  • AI Hedge Fund 5zu 利用強化學習來自動化投資組合管理並優化交易策略。
    0
    0
    AI Hedge Fund 5zu 是什麼?
    AI Hedge Fund 5zu 提供完整的量化交易流程:可自定義多資產類別模擬環境、基於強化學習的代理模組、回測工具、實時市場數據整合與風險管理工具。用戶可以配置數據來源,定義獎勵函數,使用歷史數據訓練代理,並在重要金融指標上評估性能。此框架支援模組化策略開發,可擴展至實時經紀商 API 用於部署生產級交易機器人。
  • 開源Python工具包,提供隨機、基於規則的圖案識別與強化學習代理,用於石頭剪刀布。
    0
    0
    AI Agents for Rock Paper Scissors 是什麼?
    AI代理人石頭剪刀布是一個開源Python專案,展示如何在經典遊戲中建立、訓練和評估不同的AI策略——隨機、規則基圖案識別與強化學習(Q-學習)。它提供模組化的代理類別、可配置的遊戲執行器、性能記錄與視覺化工具。用戶可以輕鬆交換代理、調整學習參數,並探索AI在競爭場景中的行為。
  • Ant_racer 是一個使用 OpenAI/Gym 和 Mujoco 的虛擬多智能體追逐-逃避平台。
    0
    0
    Ant_racer 是什麼?
    Ant_racer 是一個虛擬多智能體追逐-逃避平台,提供一個用於研究多智能體強化學習的遊戲環境。基於 OpenAI Gym 和 Mujoco,允許用戶在追逐與逃避任務中模擬多個自主智能體之間的互動。該平台支持在物理真實的環境中實現和測試如 DDPG 等強化學習算法。對於關注動態場景中 AI 多智能體行為的研究者和開發者非常有用。
  • 一個Python OpenAI Gym環境,模擬啤酒遊戲供應鏈,用於訓練和評估RL代理。
    0
    0
    Beer Game Environment 是什麼?
    啤酒遊戲環境提供一個四階段啤酒供應鏈——零售商、批發商、經銷商與製造商的離散時間模擬,並曝光OpenAI Gym介面。代理會收到包括現有庫存、管線庫存和進貨訂單的觀察資訊,然後輸出訂貨量。該環境計算每步的庫存持有和缺貨成本,並支持可定制的需求分布和領先時間。它可與熱門RL庫如Stable Baselines3無縫集成,方便研究人員和教育者在供應鏈優化任務中進行基準測試和訓練。
精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
EaseMate AI
一站式 AI 助理,將聊天、寫作、學習輔助、圖片創作與影片生成整合於同一個基於瀏覽器的平台。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
InstantChapters
即時生成吸引人的書籍章節。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Claude API
Claude API for Everyone
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。