MLX Whisper MCP

0
0 리뷰
4 Stars
MLX Whisper MCP는 직렬 파일, base64 데이터 및 YouTube 비디오 입력을 지원하는 오디오 전사 기능을 제공하는 독립형 Python 기반 서버입니다. 고품질 MLX Whisper 모델을 활용하고 Apple Silicon Mac에 최적화되어 있으며, 종속성 관리를 자동화하고 디버깅을 위한 풍부한 콘솔을 제공합니다. 이는 로컬 워크플로 또는 애플리케이션에 음성-텍스트 기능을 통합하는 데 이상적입니다.
추가 날짜:
작성자:
Apr 11 2025
MLX Whisper MCP

MLX Whisper MCP

0 리뷰
4
0
MLX Whisper MCP
MLX Whisper MCP는 직렬 파일, base64 데이터 및 YouTube 비디오 입력을 지원하는 오디오 전사 기능을 제공하는 독립형 Python 기반 서버입니다. 고품질 MLX Whisper 모델을 활용하고 Apple Silicon Mac에 최적화되어 있으며, 종속성 관리를 자동화하고 디버깅을 위한 풍부한 콘솔을 제공합니다. 이는 로컬 워크플로 또는 애플리케이션에 음성-텍스트 기능을 통합하는 데 이상적입니다.
추가 날짜:
Created by:
Apr 11 2025
Kachi O
추천

MLX Whisper MCP란?

이 MCP(모델 컨텍스트 프로토콜) 서버는 Apple Silicon Mac에서 MLX Whisper를 사용하여 고품질 오디오 전사를 가능하게 합니다. 직접 오디오 파일 경로, base64 인코딩된 오디오 데이터 및 YouTube 비디오를 포함한 여러 입력 방법을 지원하여 다양한 전사 요구 사항에 적합합니다. 서버는 uv를 통해 종속성 설치를 자동화하고 임시 파일을 관리하며 원본 오디오와 함께 전사를 저장합니다. 고급 MLX Whisper large-v3-turbo 모델을 활용하여 정확한 전사를 제공하며, 특히 Mac 환경에서 로컬 음성 인식 기능을 요구하는 개발자들에게 원활하고 효율적인 솔루션을 제공합니다.

MLX Whisper MCP을 사용할 사람은?

  • 로컬 음성-텍스트 솔루션이 필요한 개발자
  • 오디오 전사 작업을 하는 연구원
  • AI 프로젝트를 위해 Apple Silicon Mac을 사용하는 Mac 사용자
  • 워크플로에 전사를 통합하는 팀
  • 동영상의 전사가 필요한 콘텐츠 제작자

MLX Whisper MCP 사용 방법은?

  • 1단계: Mac에 Python 3.12 이상을 설치합니다.
  • 2단계: 다음 명령을 사용하여 서버를 실행합니다: `uv run mlx_whisper_mcp.py`.
  • 3단계: API 호출 또는 클라이언트 통합을 통해 지원되는 도구인 `transcribe_file`, `transcribe_audio` 또는 `transcribe_youtube`를 사용합니다.
  • 4단계: 파일 경로, base64 오디오 데이터 또는 YouTube URL과 같은 필요한 입력 매개변수를 제공합니다.
  • 5단계: 입력과 함께 저장되는 텍스트 파일로서의 전사 출력을 받습니다.
  • 6단계: 업데이트나 변경을 위해 서버를 필요에 따라 중지하거나 재시작합니다.

MLX Whisper MCP의 핵심 기능 및 장점

핵심 기능
  • transcribe_file: 디스크에서 오디오 파일을 전사합니다
  • transcribe_audio: base64 인코딩된 오디오 데이터를 전사합니다
  • download_youtube: YouTube 비디오를 다운로드합니다
  • transcribe_youtube: YouTube 비디오를 다운로드하고 전사합니다
장점
  • 유연성을 위한 여러 입력 형식 지원
  • Apple Silicon Mac에 최적화
  • 자동 종속성 관리
  • MLX Whisper large-v3-turbo 모델을 사용한 고품질 전사
  • 디버깅을 위한 풍부한 콘솔 출력

MLX Whisper MCP의 주요 사용 사례 및 애플리케이션

  • 로컬에서 팟캐스트나 인터뷰 전사
  • YouTube의 비디오 콘텐츠 전사의 자동화
  • Mac 기반 AI 워크플로에 음성 인식 통합
  • 높은 정확도의 전사가 필요한 연구 프로젝트
  • 자막이나 전사를 생성하는 콘텐츠 제작자

MLX Whisper MCP의 자주 묻는 질문

개발자

  • kachiO

당신은 또한 좋아할 수 있습니다:

개발자 도구

서버 및 클라이언트 상호작용을 관리하기 위한 데스크탑 응용 프로그램으로 폭넓은 기능을 제공합니다.
Eagle과 데이터 소스 간의 데이터 교환을 관리하는 Model Context Protocol 서버입니다.
채팅 환경 내에서 다양한 MCP 도구를 통합하여 직접 사용할 수 있는 채팅 기반 클라이언트로, 생산성을 향상시킵니다.
통합된 진입점을 통해 접근 가능한 여러 MCP 서버를 호스팅하는 Docker 이미지로, supergateway 통합이 포함되어 있습니다.
MCP 프로토콜을 통해 YNAB 계정 잔액, 거래 및 거래 생성을 제공합니다.
실시간 다수 클라이언트 Zerodha 거래 작업을 관리하기 위한 빠르고 확장 가능한 MCP 서버.
MCP 서버에 대한 원격 도구 활용을 위한 안전한 프록시 기반 접속을 용이하게 하는 원격 SSH 클라이언트.
Minecraft 모드 간의 통신 프로토콜 관리 및 처리에 AI 기능을 통합한 Spring 기반 MCP 서버.
필수 채팅 기능을 지원하는 미니멀한 MCP 클라이언트로, 다중 모델 및 맥락 기반 상호작용을 지원합니다.
AI 에이전트가 2FA 코드 및 비밀번호를 위해 Authenticator 앱과 상호 작용할 수 있도록 하는 안전한 MCP 서버입니다.

연구 및 데이터

모델 컨텍스트 프로토콜을 지원하는 서버 구현으로, CRIC의 산업 AI 기능을 통합합니다.
발렌시아시의 실시간 교통, 대기 질, 날씨 및 자전거 공유 데이터를 통합된 플랫폼에서 제공합니다.
Supabase와의 통합을 보여주는 React 애플리케이션, MCP 도구 및 UI 구성 요소 등록을 위한 Tambo를 통해.
웹 검색을 위한 Brave Search API를 통합한 MCP 클라이언트로, 효율적인 통신을 위한 MCP 프로토콜을 활용합니다.
Umbraco CMS와 외부 애플리케이션 간의 원활한 통신을 가능하게 하는 프로토콜 서버.
NOL은 LangChain과 Open Router를 통합하여 Next.js를 사용하여 다중 클라이언트 MCP 서버를 구축합니다.
LLM을 Firebolt 데이터 웨어하우스에 연결하여 자율 쿼리, 데이터 접근 및 인사이트 생성을 수행합니다.
AI 에이전트를 MCP 서버에 연결하여 도구 발견 및 통합을 가능하게 하는 클라이언트 프레임워크입니다.
Spring Link는 통합된 환경 내에서 여러 Spring Boot 애플리케이션의 연결 및 관리를 효율적으로 지원합니다.
Claude를 위한 도구 접근을 원활하게 해주는 다수의 MCP 서버와 상호작용할 수 있는 오픈 소스 클라이언트입니다.

AI 챗봇

API, AI 및 자동화를 통합하여 서버 및 클라이언트 기능을 동적으로 향상시킵니다.
MCP 표준을 통해 맥락 정보를 저장하고 검색하여 LLM에 대한 장기 기억을 제공합니다.
정밀 의학과 종양학 연구를 지원하는 유연한 검색 옵션을 갖춘 고급 임상 증거 분석 서버.
A2A 에이전트, 도구, 서버 및 클라이언트를 수집하여 효과적인 에이전트 통신 및 협업을 위한 플랫폼입니다.
AI 서비스, MCP 및 memGPT와 통합된 Cloud Foundry용 Spring 기반 챗봇입니다.
OS 수준 도구를 사용하여 macOS를 제어하는 AI 에이전트로, MCP와 호환되며 AI를 통해 시스템 관리를 용이하게 합니다.
SSE, StdIO 또는 외부 프로세스를 통해 MCP 서버와 상호 작용할 수 있는 PHP 클라이언트 라이브러리입니다.
자동화 작업을 위한 자율 에이전트, 도구, 서버 및 클라이언트를 관리하고 배포하는 플랫폼입니다.
멀티미디어 콘텐츠 생성을 위한 강력한 텍스트 음성 변환 및 비디오 생성 API와의 상호 작용을 가능하게 합니다.
원활한 통합을 위해 RedNote (XiaoHongShu, xhs)에 대한 API 액세스를 제공하는 MCP 서버입니다.