MLX Whisper MCP

0
MLX Whisper MCP - это автономный сервер на основе Python, который предоставляет возможности транскрипции аудио и поддерживает прямые файлы, данные в base64 и ввод видео с YouTube. Он использует качественную модель MLX Whisper и оптимизирован для Mac с Apple Silicon, автоматизируя управление зависимостями и предлагая богатую консоль для отладки. Идеален для интеграции функций распознавания речи в локальные рабочие процессы или приложения.
Добавлено:
Создано:
Apr 11 2025
MLX Whisper MCP

MLX Whisper MCP

0 Отзывы
4
0
MLX Whisper MCP
MLX Whisper MCP - это автономный сервер на основе Python, который предоставляет возможности транскрипции аудио и поддерживает прямые файлы, данные в base64 и ввод видео с YouTube. Он использует качественную модель MLX Whisper и оптимизирован для Mac с Apple Silicon, автоматизируя управление зависимостями и предлагая богатую консоль для отладки. Идеален для интеграции функций распознавания речи в локальные рабочие процессы или приложения.
Добавлено:
Created by:
Apr 11 2025
Kachi O
Рекомендуемые
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
ThumbnailCreator.com
Инструмент с искусственным интеллектом для быстрого и легкого создания впечатляющих профессиональных миниатюр YouTube.
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
FalcoCut
FalcoCut: веб-ориентированная AI-платформа для перевода видео, аватарных видео, клонирования голоса, замены лиц и генерации коротких видео.
Telegram Group Bot
TGDesk — универсальный бот для групп в Telegram, позволяющий собирать лиды, повышать вовлечённость и развивать сообщества.
SOLM8
ИИ‑подруга, которую вы можете позвать и с которой общаться. Реальные голосовые беседы с памятью. Каждое мгновение с ней кажется особенным.
LTX-2 AI
Open-source LTX-2 генерирует 4K-видео с нативной синхронизацией аудио по текстовым или графическим подсказкам, быстро и готово к производству.
Vertech Academy
Vertech предлагает AI-подсказки, созданные для помощи студентам и преподавателям в эффективном обучении и преподавании.

Что такое MLX Whisper MCP?

Этот сервер MCP (Context Model Protocol) позволяет высококачественную транскрипцию аудио с использованием MLX Whisper на Mac с Apple Silicon. Он поддерживает несколько методов ввода, включая прямые пути к аудиофайлам, базовые аудиоданные в формате base64 и видео с YouTube, что делает его универсальным для различных потребностей транскрипции. Сервер автоматически устанавливает зависимости через uv, управляет временными файлами и сохраняет транскрипции рядом с оригинальным аудио. Он использует продвинутую MLX Whisper large-v3-turbo модель для точной транскрипции, предоставляя плавное и эффективное решение для разработчиков, требующих локальных возможностей распознавания речи, особенно в среде Mac.

Кто будет использовать MLX Whisper MCP?

  • Разработчики, требующие локальные решения для преобразования речи в текст
  • Исследователи, работающие над транскрипцией аудио
  • Пользователи Mac, использующие Mac с Apple Silicon для проектов AI
  • Команды, интегрирующие транскрипции в рабочие процессы
  • Создатели контента, которым нужны транскрипции видео

Как использовать MLX Whisper MCP?

  • Шаг 1: Установите Python 3.12 или более поздней версии на ваш Mac.
  • Шаг 2: Запустите сервер с использованием команды: `uv run mlx_whisper_mcp.py`.
  • Шаг 3: Используйте поддерживаемые инструменты, такие как `transcribe_file`, `transcribe_audio` или `transcribe_youtube`, через вызовы API или интеграции клиентов.
  • Шаг 4: Предоставьте необходимые параметры ввода, такие как путь к файлу, данные аудио в base64 или URL-адрес YouTube.
  • Шаг 5: Получите вывод транскрипции, который также сохраняется в текстовом файле рядом с вводом.
  • Шаг 6: Остановите или перезапустите сервер по мере необходимости для обновлений или изменений.

Ключевые Особенности и Преимущества MLX Whisper MCP

Основные функции
  • transcribe_file: Транскрибирует аудиофайл с диска
  • transcribe_audio: Транскрибирует базовые аудиоданные в формате base64
  • download_youtube: Загружает видео с YouTube
  • transcribe_youtube: Загружает и транскрибирует видео с YouTube
Преимущества
  • Поддерживает несколько форматов ввода для гибкости
  • Оптимизирован для Mac с Apple Silicon
  • Автоматизированное управление зависимостями
  • Высококачественная транскрипция с использованием модели MLX Whisper large-v3-turbo
  • Богатый вывод консоли для отладки

Основные Сценарии Использования и Приложения MLX Whisper MCP

  • Локальная транскрипция подкастов или интервью
  • Автоматизация транскрипции видео содержания с YouTube
  • Интеграция распознавания речи в рабочие процессы на основе Mac
  • Исследовательские проекты, требующие транскрипций с высокой точностью
  • Создатели контента, генерирующие субтитры или транскрипты

Часто Задаваемые Вопросы о MLX Whisper MCP

Разработчик

  • kachiO

Вам также может понравиться:

Инструменты разработчика

Настольное приложение для управления взаимодействиями между сервером и клиентом с полными функциональными возможностями.
Сервер Model Context Protocol для Eagle, который управляет обменом данными между приложением Eagle и источниками данных.
Чат-клиент, который интегрирует и использует различные инструменты MCP прямо в чат-среде для повышения производительности.
Изображение Docker, размещающее несколько соединений MCP, доступных через единый входной пункт с интеграцией supergateway.
Обеспечивает доступ к балансам счетов YNAB, транзакциям и созданию транзакций через протокол MCP.
Быстрый и масштабируемый сервер MCP для управления операциями торговли в режиме реального времени для нескольких клиентов Zerodha.
Удаленный SSH-клиент, который облегчает безопасный, основанный на прокси-доступ к серверам MCP для удаленного использования инструментов.
Сервер MCP на базе Spring с возможностями ИИ для управления и обработки протоколов коммуникации модов Minecraft.
Минималистичный MCP-клиент с основными функциями чата, поддерживающий несколько моделей и контекстные взаимодействия.
Защищенный MCP сервер, позволяющий агентам ИИ взаимодействовать с приложением Authenticator для получения кодов 2FA и паролей.

Исследования и данные

Реализация сервера, поддерживающая Протокол Контекста Модели, интегрирующая возможности промышленного ИИ CRIC.
Предоставляет данные о движении, качестве воздуха, погоде и прокате велосипедов в городе Валенсия в единой платформе в реальном времени.
Приложение на React, демонстрирующее интеграцию с Supabase через инструменты MCP и Tambo для регистрации компонентов пользовательского интерфейса.
Клиент MCP, интегрирующий API Brave Search для веб-поиска, использующий протокол MCP для эффективной коммуникации.
Сервер протокола, обеспечивающий бесперебойную связь между Umbraco CMS и внешними приложениями.
NOL интегрирует LangChain и Open Router для создания сервера MCP с несколькими клиентами на основе Next.js.
Соединяет LLM с Firebolt Data Warehouse для автономных запросов, доступа к данным и генерации инсайтов.
Клиентская платформа для соединения ИИ-агентов с серверами MCP, позволяющая обнаружение и интеграцию инструментов.
Spring Link упрощает связывание и управление несколькими приложениями Spring Boot эффективно в единой среде.
Клиент с открытым исходным кодом для взаимодействия с несколькими серверами MCP, обеспечивающий бесшовный доступ к инструментам для Claude.

AI-чатбот

Интегрирует API, ИИ и автоматизацию для динамического улучшения функциональности сервера и клиента.
Предоставляет долгосрочную память для LLM, храня и извлекая контекстную информацию через стандарты MCP.
Совершенный сервер анализа клинических данных, поддерживающий прецизионную медицину и онкологические исследования с гибкими опциями поиска.
Платформа, собирающая A2A-агентов, инструменты, серверы и клиенты для эффективной коммуникации и сотрудничества между агентами.
Чат-бот на базе Spring для Cloud Foundry, который интегрируется с AI-сервисами, MCP и memGPT для расширенных возможностей.
AI-агент, управляемый macOS с помощью инструментов уровня ОС, совместим с MCP, упрощая управление системой через ИИ.
PHP-клиентская библиотека, позволяющая взаимодействовать с серверами MCP через SSE, StdIO или внешние процессы.
Платформа для управления и развертывания автономных агентов, инструментов, серверов и клиентов для автоматизации задач.
Обеспечивает взаимодействие с мощными API преобразования текста в речь и генерации видео для создания мультимедийного контента.
Сервер MCP, предоставляющий доступ к API для RedNote (XiaoHongShu, xhs) для бесшовной интеграции.