apprentissage par renforcement

  • 開放原始碼的多代理AI框架,用於影片中的協作物體追蹤,結合深度學習與強化決策。
    0
    0
    Multi-Agent Visual Tracking 是什麼?
    多代理視覺追蹤實現一個分散式追蹤系統,由互相通信的智能代理組成,以提升影片物件追蹤的準確性與韌性。代理執行卷積神經網路進行偵測、共享觀察以處理遮擋,並透過強化學習調整追蹤參數。相容於主要的影片資料集,支持訓練與即時推理。用戶可輕鬆整合於現有流程,並擴展代理行為以符合客製化應用。
  • 一個開源的多智能體強化學習框架,通過PySC2在星際爭霸II中實現原始層級的代理控制與協調。
    0
    0
    MultiAgent-Systems-StarCraft2-PySC2-Raw 是什麼?
    MultiAgent-Systems-StarCraft2-PySC2-Raw提供一整套工具組,用於在星際爭霸II中開發、訓練與評估多個AI代理。它暴露低層次控制單位移動、目標指向和技能,同時支持彈性的獎勵設計與場景配置。用戶可以輕鬆插入自定義神經網路架構、定義隊伍協調策略,並記錄指標。基於PySC2,支援並行訓練、檢查點與視覺化,非常適合推動合作與對抗多智能體強化學習的研究。
  • 一個基於Python的多智能體增強學習框架,用於開發和模擬合作與競爭的AI智能體環境。
    0
    0
    Multiagent_system 是什麼?
    Multiagent_system提供了一套完整的工具包,用於構建和管理多智能體環境。用戶可以定義自訂模擬場景、指定智能體行為,並利用預先實現的算法如DQN、PPO和MADDPG。該框架支持同步和異步訓練,使智能體能同時或輪流互動。內建的通信模組促進智能體間的訊息傳遞,用於合作策略。通過YAML文件簡化實驗配置,結果自動記錄為CSV或TensorBoard格式。視覺化脚本幫助解釋智能體軌跡、獎勵演變和通信模式。Designed for research and production workflows, Multiagent_system seamlessly scales from single-machine prototypes to distributed training on GPU clusters.
  • 一個基於Python的多智能體模擬框架,可在可定制的環境中實現同時的智能體協作、競爭和訓練。
    0
    0
    MultiAgentes 是什麼?
    MultiAgentes採用模組化架構來定義環境和智能體,支持同步和異步的多智能體互動。它包含環境和智能體的基礎類別,預定義的合作和競爭任務方案,用於自定義獎勵函數的工具,以及通信和觀察分享的API。可視化工具允許實時監控智能體行為,同時記錄模組記錄性能指標供分析。該框架能與Gym兼容的強化學習庫無縫集成,讓使用者可以用現有演算法訓練智能體。MultiAgentes設計為可擴展性,允許開發者添加新的環境模板、智能體類型和通信協議,以適應多樣的研究與教育應用。
  • 開源框架,實現並評估在經典吃豆人遊戲環境中的多智能體AI策略。
    0
    0
    MultiAgentPacman 是什麼?
    MultiAgentPacman提供一個基於Python的遊戲環境,使用戶能夠在Pacman領域中實現、可視化和基準多個AI代理。它支持對抗搜索算法,如Minimax、Expectimax、α-β剪枝,以及用於強化學習或啟發式的方法的自定義代理。該框架包含簡潔的GUI、命令行控制和用於記錄比賽統計及比較性能的工具,支持競爭或合作場景。
  • 一個開源的Python框架,可實現合作與競爭多智能體增強學習系統的設計、訓練與評估。
    0
    0
    MultiAgentSystems 是什麼?
    MultiAgentSystems旨在簡化建構與評估多智能體增強學習(MARL)應用的流程。平台包括最先進的算法實作,如MADDPG、QMIX、VDN,以及集中式訓練和去中心化執行。它具有模組化的環境包裝器,與OpenAI Gym相容,通信協議支持代理間交互,並提供記錄工具追蹤獎勵塑造、收斂率等指標。研究者可以自訂代理架構、調整超參數,並模擬合作導航、資源配置、對抗性遊戲等場景。配合PyTorch、GPU加速與TensorBoard整合,MultiAgentSystems加速合作與競爭多智能體領域的實驗與基準測試。
  • 一個用於在模擬環境中訓練無碰撞多機器人導航策略的增強學習框架。
    0
    0
    NavGround Learning 是什麼?
    NavGround Learning提供一套完整工具,用於開發與測試導航任務中的增強學習代理。支援多代理模擬、碰撞建模,以及可定制的感測器與執行器。使用者可選擇預設策略模板或實現自訂架構,並使用最先進的RL演算法進行訓練,還能視覺化性能指標。與OpenAI Gym和Stable Baselines3的整合,讓實驗管理更為便利,內建記錄與視覺化工具則助於深入分析代理行為與訓練動態。
  • OpenSpiel 提供一個環境和算法庫,用於強化學習和遊戲理論規劃的研究。
    0
    0
    OpenSpiel 是什麼?
    OpenSpiel 是一個研究框架,提供從簡單矩陣遊戲到複雜棋類遊戲(如國際象棋、圍棋和撲克)的廣泛環境,並實現各種強化學習和搜索算法(如值迭代、策略梯度方法、MCTS)。其模組化的 C++ 核心和 Python 綁定允許用戶插入自定義算法、定義新遊戲,並在標準基準上比較性能。設計具有擴展性,支持單一和多智能體設置,研究合作和競爭場景。研究人員利用 OpenSpiel 快速原型設計算法、大規模實驗和分享可重複的代碼。
  • Pits and Orbs 提供一個多代理格子世界環境,AI代理在此避免陷阱、收集寶珠,並在回合制場景中競爭。
    0
    0
    Pits and Orbs 是什麼?
    Pits and Orbs是一個用Python實作的開源強化學習環境,提供回合制多代理格子世界,在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航,避免隨機放置的陷阱(會懲罰或終止回合),並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式,讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構,以及選擇性註解訓練數據追踪。
  • 一個讓用戶可以開發並訓練用於對戰寶可夢的AI代理的Python框架,利用強化學習技術。
    0
    0
    Poke-Env 是什麼?
    Poke-Env旨在透過提供完整的Python介面來簡化寶可夢Showdown對戰的AI代理建立與評估工作。它處理與Pokémon Showdown伺服器的通訊、解析遊戲狀態資料,並利用事件驅動架構管理每回合的行動。用戶可以擴展基本玩家類別以實作使用強化學習或啟發式演算法的自訂策略。此框架支援內建的對戰模擬、平行對戰以及詳細記錄行動、獎勵與結果,便於複現研究。藉由抽象底層網路與解析任務,Poke-Env讓AI研究人員與開發者專注於演算法設計、性能優化與策略比較。
  • PyBrain:基於Python的模組化機器學習和神經網絡庫。
    0
    0
    pybrain.org 是什麼?
    PyBrain,即Python基於強化學習、人工智能和神經網絡庫的簡稱,是一個模組化的開源庫,專為機器學習任務設計。它支持構建神經網絡、強化學習及其他AI算法。憑藉其強大且易於使用的算法,PyBrain為開發者和研究人員提供了有價值的工具,以解決各種機器學習問題。該庫與其他Python庫平滑集成,適用於從簡單的監督學習到複雜的強化學習情境的任務。
  • PyGame Learning Environment 提供一套基於 Pygame 的強化學習環境,用於訓練和評估經典遊戲中的 AI 代理。
    0
    0
    PyGame Learning Environment 是什麼?
    PyGame Learning Environment(PLE)是一個開源的 Python 框架,旨在簡化在自訂遊戲場景中開發、測試和基準強化學習代理的流程。它提供一套輕量級的基於 Pygame 的遊戲,內建支持代理觀察、離散與連續動作空間、獎勵塑形和環境渲染。PLE 擁有一個易於使用的 API,與 OpenAI Gym 包裝器相容,可與 popular RL 函式庫(如 Stable Baselines 和 TensorForce)無縫整合。研究人員與開發者能夠客製化遊戲參數、實現新遊戲,並運用向量化環境以加快訓練速度。藉由活躍的社群貢獻與豐富的文件說明,PLE 成為一個多用途的平台,適用於學術研究、教育與現實應用原型設計。
  • 一個提供 DQN、PPO 和 A2C 代理人,用於在 PettingZoo 遊戲中進行多智能體強化學習的 GitHub 倉庫。
    0
    0
    Reinforcement Learning Agents for PettingZoo Games 是什麼?
    PettingZoo 遊戲的強化學習代理人是一個基於 Python 的程式庫,提供現成的 DQN、PPO 和 A2C 演算法,用於 PettingZoo 環境下的多智能體強化學習。具有標準化的訓練與評估腳本、可配置的超參數、整合的 TensorBoard 日誌記錄,以及支持競爭和合作遊戲。研究人員和開發者可以克隆倉庫、調整環境與演算法參數、運行訓練並視覺化指標,以快速進行多智能體 RL 實驗和基準測試。
  • simple_rl是一個輕量級的Python庫,提供預構建的增強學習代理和環境,支持快速RL實驗。
    0
    0
    simple_rl 是什麼?
    simple_rl是一個簡約的Python庫,旨在簡化增強學習的研究和教育。它提供一致的API用於定義環境和代理,內置支援常見RL範式,包括Q-learning、蒙特卡羅方法和動態規劃算法如價值和策略迭代。該框架包括範例環境,如GridWorld、MountainCar和多臂強盜,方便實操實驗。用戶可以擴展基類實現自定義環境或代理,並利用工具函數進行記錄、性能追蹤和策略評估。simple_rl的輕量架構和清晰代碼使其非常適合快速原型、教授RL基礎,以及在可重現且易於理解的環境中進行新算法的基準測試。
  • RL Shooter 提供一個可自訂的基於 Doom 的強化學習環境,用於訓練 AI 代理在第一人稱射擊遊戲中導航與射擊目標。
    0
    0
    RL Shooter 是什麼?
    RL Shooter 是一個基於 Python 的框架,整合 ViZDoom 與 OpenAI Gym API,以建立一個彈性的 FPS 遊戲強化學習環境。使用者可自訂場景、地圖及獎勵結構,以進行導航、目標偵測和射擊任務的訓練。它支援可配置的觀察幀、行動空間與日誌功能,並支援流行的深度 RL 函式庫,例如 Stable Baselines 和 RLlib,以提供明確的性能追蹤及實驗可重複性。
  • 一個多智能體強化學習環境,模擬吸塵機器人協作導航與清理動態格狀場景。
    0
    0
    VacuumWorld 是什麼?
    VacuumWorld是一個開源模擬平台,旨在促進多智能體強化學習算法的開發與評估。它提供基於格子的環境,虛擬吸塵機器人可在可自定義的布局中運行,檢測並清除塵埃。用戶可以調整網格大小、塵埃分佈、隨機移動噪聲與獎勵結構,以模擬多種場景。框架內建支持智能體之間的通訊協議、即時視覺化儀表板及性能追蹤的紀錄工具。透過簡單的Python API,研究人員可以快速整合其強化學習算法,比較合作或競爭策略並進行可重現的實驗,讓VacuumWorld成為學術研究與教學的理想工具。
  • 一個基於Python Pygame的環境,用於在可自定義賽道上開發和測試強化學習自主駕駛代理。
    0
    0
    SelfDrivingCarSimulator 是什麼?
    SelfDrivingCarSimulator是一個基於Pygame的輕量級Python框架,提供一個2D駕駛環境,用於訓練自主車輛代理,利用強化學習。它支持可客製化的賽道佈局、可配置的感測器模型(如LiDAR和相機模擬)、實時視覺化以及性能數據記錄。開發者可以整合其RL算法,調整物理參數,監控速度、碰撞率和獎勵函數等指標,以快速推進自主駕駛研究與教育項目。
  • 牧羊是一個基於Python的強化學習框架,用於在模擬中訓練AI代理以驅使和引導多個代理。
    0
    0
    Shepherding 是什麼?
    牧羊是一個開源的模擬框架,設計用於強化學習研究人員與開發者來研究和實現多代理牧羊任務。它提供一個兼容Gym的環境,代理可以在連續或離散空間中執行側翼、收集與分散目標群的行為。該框架包括模組化的獎勵塑造函數、環境參數設定與訓練性能監控工具。用戶可定義障礙物、動態代理族群和自訂策略,利用TensorFlow或PyTorch。視覺化腳本生成軌跡圖與影片紀錄。牧羊的模組設計允許與現有RL庫完美整合,實現可重現的實驗、創新協作策略的基準測試,以及快速原型設計AI驅動的牧羊解決方案。
  • 一個Python框架,使合作多智能體系統的設計、模擬和強化學習成為可能。
    0
    0
    MultiAgentModel 是什麼?
    MultiAgentModel提供統一API,用於定義多智能體場景的自訂環境和智能體類。開發者可以指定觀察與行動空間、獎勵結構和通信通道。內建支持流行的RL算法如PPO、DQN和A2C,讓訓練變得簡單配置。實時可視化工具協助監控智能體互動和績效指標。模塊化架構確保易於整合新算法與自訂模組。此外,還包括用於超參數調優的彈性配置系統、實驗追蹤的日誌工具,以及與OpenAI Gym環境的相容性,實現無縫移植。用戶可以在共享環境合作,並重播記錄的會話進行分析。
  • 一個開源的Python框架,具有基於Pacman的AI代理,用於實現搜尋、對抗和強化學習算法。
    0
    0
    Berkeley Pacman Projects 是什麼?
    Berkeley Pacman Projects的倉庫提供一個模組化的Python程式碼庫,讓用戶在Pacman迷宮中建立並測試AI代理。它引導學習者進行非知情和知情搜尋(DFS、BFS、A*)、對抗性多智能體搜尋(minimax、alpha-beta剪枝),以及強化學習(Q-learning與特徵擷取)。整合的圖形界面實時視覺化代理行為,內建測試案例與自動評分驗證算法正確性。透過反覆實作算法,使用者能在統一的遊戲框架中累積狀態空間探索、啟發式設計、對抗性推理與獎勵導向學習的實務經驗。
精選
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
VoxDeck
引領視覺革命的AI簡報製作工具
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
FalcoCut
FalcoCut:基於網頁的 AI 平台,用於影片翻譯、虛擬人影片、語音複製、換臉與短影片生成。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。
LTX-2 AI
開源的 LTX-2 能從文字或圖片提示快速生成具原生音頻同步的 4K 影片,且已具備生產就緒能力。
Seedance 2 AI
結合影像、影片、音訊與文字的多模態 AI 影片生成器,可創作具電影感的短片。
SOLM8
你可以呼叫並與之聊天的 AI 女友。真實語音對話並具備記憶。每一刻與她相處都特別。
Vertech Academy
Vertech 提供旨在幫助學生和教師有效學習與教學的人工智慧提示。

直覺操作的apprentissage par renforcement工具

快速掌握並使用apprentissage par renforcement工具,不論新手或專業人士,都能享受流暢的操作體驗。