MLX Whisper MCP

0
0 評論
4 Stars
MLX Whisper MCP 是一個獨立的基於 Python 的伺服器,提供音頻轉錄功能,支持直接文件、base64 數據和 YouTube 視頻輸入。它利用高品質的 MLX Whisper 模型,並針對 Apple Silicon 的 Mac 進行優化,自動管理依賴項並提供豐富的控制台以進行除錯。它非常適合將語音轉文本功能集成到本地工作流或應用程式中。
新增日期:
創建者:
Apr 11 2025
MLX Whisper MCP

MLX Whisper MCP

0 評論
4
0
MLX Whisper MCP
MLX Whisper MCP 是一個獨立的基於 Python 的伺服器,提供音頻轉錄功能,支持直接文件、base64 數據和 YouTube 視頻輸入。它利用高品質的 MLX Whisper 模型,並針對 Apple Silicon 的 Mac 進行優化,自動管理依賴項並提供豐富的控制台以進行除錯。它非常適合將語音轉文本功能集成到本地工作流或應用程式中。
新增日期:
Created by:
Apr 11 2025
Kachi O
精選
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
VoxDeck
引領視覺革命的AI簡報製作工具
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
LTX-2 AI
開源的 LTX-2 能從文字或圖片提示快速生成具原生音頻同步的 4K 影片,且已具備生產就緒能力。
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Qwen-Image-2512 AI
Qwen-Image-2512 是一款快速且高解析度的 AI 圖像生成器,原生支援中文文字渲染。
FalcoCut
FalcoCut:基於網頁的 AI 平台,用於影片翻譯、虛擬人影片、語音複製、換臉與短影片生成。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
ai song creator
使用商業授權創建長達 8 分鐘、免版稅的完整AI生成音樂。
SOLM8
你可以呼叫並與之聊天的 AI 女友。真實語音對話並具備記憶。每一刻與她相處都特別。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。
PoYo API
PoYo.ai 是為開發者打造的統一 AI API 平台,用於影像、影片、音樂和聊天生成。
Seedance 1.5 Pro
Seedance 1.5 Pro 是一款以 AI 為驅動的電影級影片生成器,具備完美的口型同步與即時音視同步功能。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
RSW Sora 2 AI Studio
使用 AI 工具立即移除 Sora 水印,零畫質損失並能快速下載。
APIMart
APIMart 提供統一介面存取超過 500 個 AI 模型(包含 GPT-5 與 Claude 4.5),並帶來成本節省。
Vertech Academy
Vertech 提供旨在幫助學生和教師有效學習與教學的人工智慧提示。
Explee
立即開始外展,使用單行描述您的理想客戶輪廓(ICP)
Vadu AI
整合 Sora 2、Veo 3、Kling 等 10 多種頂級模型的一體化 AI 影片與影像生成器。
Lease A Brain
由人工智能驅動的專家虛擬團隊,隨時協助多樣化商業任務。
NanoPic
NanoPic 提供由 AI 驅動的快速、高品質對話式圖像編輯,支援 2K/4K 輸出。
Wollo.ai
Wollo 讓你使用先進且具情感感知的 AI 技術來創建、探索並與 AI 角色聊天。
Rebelgrowth
自動化的AI驅動SEO軟體,輕鬆提升您的搜索流量和權威。
Edensign
Edensign 是一個由 AI 驅動的虛擬佈置平台,能快速且逼真地改造房地產照片。
codeflying
CodeFlying – 氛圍編碼應用程式建構器 | 與 AI 聊天即可建立全端應用程式
Camtasia online
Camtasia Online 是一款免費的螢幕錄製及影片編輯工具,全部透過您的網頁瀏覽器完成。
remio - Personal AI Assistant
remio 是一個由 AI 驅動的個人知識中心,能自動捕捉並組織您的所有數位資訊。
PXZ AI
PXZ.ai 是一個全方位的 AI 平台,提供影像、影片、語音、寫作與聊天創作工具。
TattooAI AI Tattoo Generator
AI刺青生成器利用先進的人工智慧技術,快速創建個人化且高品質的刺青設計。
yesTool.ai
一體化 AI 平台,讓您在不需技術技能的情況下創作影片、音樂和影像。
Avoid.so
Avoid.so 提供先進的 AI 人性化技術,能無縫繞過 AI 偵測算法。
Chatronix
LLM彙總器,將多個AI模型連接在一個平台上,以便比較、整合和自動化。
Z Image Turbo AI
Z Image Turbo 是一款超快速的 AI 影像生成器,可創造令人驚豔的寫實照片級藝術。
EaseUS VoiceWave
免費、強大的變聲器,適合線上線下的創意表達。

MLX Whisper MCP 是什麼?

這個 MCP(模型語境協議)伺服器能夠在 Apple Silicon 的 Mac 上使用 MLX Whisper 進行高品質音頻轉錄。它支持多種輸入方式,包括直接音頻文件路徑、base64 編碼的音頻數據和 YouTube 視頻,這使得它在各種轉錄需求上非常靈活。該伺服器通過 uv 自動安裝依賴項,管理臨時文件,並將轉錄結果與原始音頻一起保存。它利用先進的 MLX Whisper large-v3-turbo 模型進行準確的轉錄,為需要本地語音識別能力的開發人員提供了一個無縫高效的解決方案,尤其是在 Mac 環境下。

誰會使用 MLX Whisper MCP?

  • 需要本地語音轉文本解決方案的開發人員
  • 從事音頻轉錄的研究人員
  • 使用 Apple Silicon 的 Mac 進行 AI 項目的 Mac 用戶
  • 將轉錄集成到工作流中的團隊
  • 需要視頻轉錄的內容創作者

如何使用 MLX Whisper MCP?

  • 步驟 1:在你的 Mac 上安裝 Python 3.12 或更高版本。
  • 步驟 2:使用以下命令啟動伺服器:`uv run mlx_whisper_mcp.py`。
  • 步驟 3:通過 API 調用或客戶端集成使用支持的工具,如 `transcribe_file`、`transcribe_audio` 或 `transcribe_youtube`。
  • 步驟 4:提供所需的輸入參數,如文件路徑、base64 音頻數據或 YouTube URL。
  • 步驟 5:接收轉錄輸出,該結果也會作為文本文件與輸入一起保存。
  • 步驟 6:根據需要停止或重新啟動伺服器以進行更新或更改。

MLX Whisper MCP 的核心特徵與益處

主要功能
  • transcribe_file:從磁碟轉錄音頻文件
  • transcribe_audio:轉錄 base64 編碼的音頻數據
  • download_youtube:下載 YouTube 視頻
  • transcribe_youtube:下載並轉錄 YouTube 視頻
優點
  • 支持多種輸入格式以獲得靈活性
  • 針對 Apple Silicon 的 Mac 進行優化
  • 自動管理依賴項
  • 使用 MLX Whisper large-v3-turbo 模型的高品質轉錄
  • 提供豐富的控制台輸出以進行除錯

MLX Whisper MCP 的主要使用案例與應用

  • 本地轉錄播客或訪談
  • 自動化 YouTube 內容的轉錄
  • 將語音識別集成到基於 Mac 的 AI 工作流
  • 需要高精度轉錄的研究項目
  • 生成字幕或轉錄的內容創作者

MLX Whisper MCP 的常見問答

開發者

  • kachiO

您可能也喜歡:

開發者工具

一款用於管理伺服器與客戶端互動的桌面應用程式,具備全面的功能。
一個為 Eagle 提供的 Model Context Protocol 伺服器,負責管理 Eagle 應用程式和數據來源之間的數據交換。
一個基於聊天的客戶端,直接在聊天環境中集成和使用各種 MCP 工具,以提高生產力。
一個 Docker 映像,承載多個 MCP 伺服器,透過整合 supergateway 以統一入口點訪問。
透過 MCP 協議提供 YNAB 帳戶餘額、交易及交易創建的訪問權限。
一個快速可擴展的MCP伺服器,用於管理多客戶的即時Zerodha交易操作。
一個遠端SSH客戶端,方便安全、基於代理訪問MCP伺服器,以便利用遠端工具。
一個基於Spring的MCP伺服器,整合了AI能力以管理和處理Minecraft模組的通信協議。
一款具有基本聊天功能的極簡MCP客戶端,支持多種模型和上下文交互。
一個安全的MCP伺服器,讓AI代理與身份驗證器應用程式互動以獲取2FA代碼和密碼。

研究與數據

一個支持模型上下文協議的伺服器實現,整合CRIC的工業AI能力。
提供瓦倫西亞市即時交通、空氣質量、天氣及單車共享數據於一個統一的平台上。
一個展示通過MCP工具和Tambo進行Supabase集成的React應用程序,註冊UI組件。
整合 Brave Search API 用於網頁搜尋的 MCP 客戶端,利用 MCP 協議進行高效通信。
一個能夠實現 Umbraco CMS 與外部應用程式之間無縫通訊的協定伺服器。
NOL 整合了 LangChain 和 Open Router,以使用 Next.js 創建一個多客戶端的 MCP 伺服器。
將LLM連接到Firebolt數據倉庫,以進行自主查詢、數據訪問和洞察生成。
一個用於將AI代理連接到MCP伺服器的客戶端框架,實現工具的發現和集成。
Spring Link 促進在統一環境中有效地鏈接和管理多個 Spring Boot 應用程序。
一個開源客戶端,用於與多個MCP伺服器互動,為Claude提供無縫的工具訪問。

AI聊天機器人

整合 API、AI 和自動化,動態增強伺服器和客戶端功能。
透過MCP標準存儲和檢索上下文信息,為大型語言模型提供長期記憶。
一個先進的臨床證據分析伺服器,支持精準醫療和肿瘤學研究,提供靈活的搜索選項。
一個收集 A2A 代理、工具、伺服器和客戶端的平台,以實現有效的代理通信和協作。
一個基於 Spring 的 Cloud Foundry 聊天機器人,與 AI 服務、MCP 和 memGPT 集成,以實現先進的功能。
一個控制macOS的AI代理,使用作業系統級工具,與MCP相容,通過AI促進系統管理。
PHP 客戶端庫,通過 SSE、StdIO 或外部進程與 MCP 伺服器進行交互。
一個管理和部署自主代理、工具、伺服器和客戶端的自動化任務平台。
使強大的文本轉語音和視頻生成API進行互動,以創建多媒體內容。
提供API訪問RedNote(小紅書,xhs)的MCP伺服器,實現無縫整合。