Service

GitHub - Blaizzy/mlx-audio: A text-to-speech (TTS), speech-to-text (STT) and speech-to-speech (STS) library built on Apple's MLX framework, providing efficient speech analysis on Apple Silicon.

Blaizzy

2026.01.24

·GitHub·by web-ghost

#MLX#TTS#STT#Speech Processing#Apple Silicon

핵심 포인트

1MLX-Audio는 Apple의 MLX framework를 기반으로 Apple Silicon에 최적화된 고성능 오디오 처리 라이브러리로, Text-to-Speech (TTS), Speech-to-Text (STT), Speech-to-Speech (STS) 기능을 제공합니다.
2이 라이브러리는 빠른 추론 속도, 다국어 지원, 음성 커스터마이징, 다양한 모델 아키텍처 지원, 그리고 3-bit부터 8-bit까지의 quantization 기능을 특징으로 합니다.
3Command Line, Python API, OpenAI 호환 REST API, 웹 인터페이스를 통해 사용 가능하며, Kokoro, Whisper, VibeVoice-ASR 등 여러 최신 모델들을 포함하여 다양한 오디오 AI 작업을 수행할 수 있습니다.

model.generate(text="...", voice="af_heart", lang_code="a")

Service

Blaizzy

2026.01.24

·GitHub·by web-ghost

#MLX#TTS#STT#Speech Processing#Apple Silicon

1MLX-Audio는 Apple의 MLX framework를 기반으로 Apple Silicon에 최적화된 고성능 오디오 처리 라이브러리로, Text-to-Speech (TTS), Speech-to-Text (STT), Speech-to-Speech (STS) 기능을 제공합니다.
2이 라이브러리는 빠른 추론 속도, 다국어 지원, 음성 커스터마이징, 다양한 모델 아키텍처 지원, 그리고 3-bit부터 8-bit까지의 quantization 기능을 특징으로 합니다.
3Command Line, Python API, OpenAI 호환 REST API, 웹 인터페이스를 통해 사용 가능하며, Kokoro, Whisper, VibeVoice-ASR 등 여러 최신 모델들을 포함하여 다양한 오디오 AI 작업을 수행할 수 있습니다.

model.generate(text="...", voice="af_heart", lang_code="a")