Audio Spaces

hysts 's Collections

Diffusion model Spaces

LLM Spaces

Audio Spaces

updated 5 days ago

Upvote

Runtime error

71

71

Whisper vs Distil-Whisper

📈
Runtime error

951

951

Seamless M4T

📞
Runtime error

5.07k

5.07k

MusicGen

🎵

Generate music from text descriptions and optional melodies
Runtime error

812

812

Audioldm Text To Audio Generation

🔊

Generate audio from text descriptions
Runtime error

308

308

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate audio and waveform video from text
Runtime error

222

222

AudioSep

🐠
Running

170

170

Lp Music Caps

🎵

Generate captions for music audio
Running on T4

311

311

Tortoise Tts

🐢

ExpressivText-to-Speech
Runtime error

22

22

All In One

📊
Runtime error

2.77k

2.77k

XTTS

🐸

Generate speech from text using a reference voice
Paused

189

189

Coqui Bark Voice Cloning

🐸
Runtime error

367

367

VALL E X

🎙

Generate audio from text using voice prompts
Sleeping

193

193

WavJourney

🔥
Paused

264

264

Music To Image

🎶
Runtime error

277

277

MMS

🌍

Transform and identify speech with MMS
Running

608

608

ElevenLabs TTS

🗣

Generate voice from text using ElevenLabs
Build error

289

289

AudioGPT

🚀
Build error

2.38k

2.38k

Bark

🐶

Generate realistic audio from text
Runtime error

36

36

SpeechT5 Speech Recognition Demo

👩
Runtime error

174

174

CoquiTTS (Official)

🐸
Running on Zero

2.58k

2.58k

Whisper

📉

Transcribe audio files or YouTube videos into text
Running on CPU Upgrade

658

658

Moe TTS

😊

Generate and convert voice with text and audio inputs
Build error

17

17

YourTTS

🔥
Running

557

557

Talking Face Generation with Multilingual TTS

👄

Generate a talking face video from text in multiple languages
Runtime error

562

562

OpenAI TTS New

📊
Build error

167

167

Mustango

🐢
Runtime error

55

55

OWSM Demo

🔊
Running on L4

698

698

StyleTTS 2

🗣

Efficient, fast, and natural text to speech with StyleTTS 2!
Runtime error

400

400

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Runtime error

21

21

Video2music

📚

Generate music for a video based on its content and key
Runtime error

187

187

Whisper Large V2

🤫
Running on T4

64

64

Musicgen Prompt Upsampling

🌖

Generate music from text prompts 🎶
Runtime error

516

516

Seamless M4T v2

📞

Translate speech and text between languages
Paused

318

318

Seamless Streaming

📞

Translate text between languages
Sleeping

52

52

Matcha TTS

🍵

Generate speech from text with speaker selection
Running on Zero

276

276

MusicGen Streaming

🔥

Generate music from text prompts
Running on T4

415

415

Resemble Enhance

🚀

Enhance and denoise your audio files
Runtime error

260

260

Singing Voice Conversion

🎼

Transform your voice into a singer's
Sleeping

52

52

NaturalSpeech2

🎧

Generate speech with cloned timbre
Paused

21

21

Create Your Own TTS Dataset

🔥
Runtime error

Podcast Transcription

🐢
Running

1.1k

1.1k

OpenVoice

🤗

Generate voice from text using a reference audio
Runtime error

94

94

M2UGen Demo

💻
Runtime error

68

68

Pheme

📊
Running

7

7

ESPnet2 TTS

📈

Convert text to speech in English, Chinese, or Japanese
Running

37

37

Whisper-WebUI

🚀

Generate subtitles and translate audio files
Running

MCP

173

173

Image2SFX Comparison

👂

Generates audio environment from an image
Runtime error

379

379

WhisperSpeech

🌬
Build error

144

144

MetaVoice 1B

🗣

A demo of MetaVoice 1B, a new TTS model by MetaVoice.
Running on CPU Upgrade

893

893

TTS Arena V2

🏆

Vote on the latest TTS models!
Running

173

173

Whisper Speech X DreamTalk

😽

Combine voice cloning and portrait lipsync animation
Runtime error

197

197

Canary 1b

🐤

Transcribe and translate audio into text
Running on Zero

MCP

81

81

SALMONN Audio Questioning

⚡

Deeply interrogate audio file content
Runtime error

467

467

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Running on Zero

311

311

Audio Editing

🎧

Edit audios with text prompts
Runtime error

18

18

ChatMusician

💻
Running on CPU Upgrade

MCP

73

73

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Configuration error

180

180

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Runtime error

25

25

Hey Gemma

☎
Running

70

70

Ratchet + Whisper

🗣

Convert audio to text
Paused

3

3

AutoSubs

📜

Automatically add on-screen subs to your videos
Build error

161

161

VoiceCraft

📈
Running on Zero

321

321

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Build error

826

826

Parler-TTS

🥖

High-fidelity Text-To-Speech
Runtime error

184

184

Sing an idea ➡️ Music

🔥

Bring song ideas to life
Runtime error

75

75

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Runtime error

145

145

Whisper JAX

👀

Transcribe or translate audio from microphone, file, or YouTube
Runtime error

22

22

AudioLCM

🏢

Generate audio from text
Runtime error

160

160

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running on Zero

447

447

Stable Audio Open Zero

🔥

Generate audio from text prompts
Running on Zero

13

13

Make An Audio 3

🐠

Generate audio from text prompts
Runtime error

60

60

Mars5 Space

📉
Configuration error

5

5

Tango Music AF

🎵

Text to Music Generator
Runtime error

16

16

Jam

🐠

Generate a song from lyrics and style reference
Running

107

107

BigVGAN

🔊

Generate high-quality audio from input audio
Runtime error

89

89

SenseVoice

🐠

Transcribe audio with emotions and events
Runtime error

29

29

PicoAudio

📈

Generate audio from text descriptions with timestamps
Build error

7

7

Audio Flamingo Demo

📚
Runtime error

29

29

MusiConGen

🪩
Running

20

20

Mms Zeroshot

🌍

Transcribe audio in any language using text data
Running on Zero

200

200

GPT SoVITS V2 Pro Plus

🤗

Generate speech from text using reference audio
Runtime error

274

274

EzAudio

🟣

Generate and edit audio from text prompts
Build error

214

214

OpenMusic

🎶

Generate music from text descriptions
Running on Zero

545

545

Midi Music Generator

🎼

Generate MIDI music from prompts
Running on Zero

987

987

Whisper Turbo

🤯

Transcribe audio or YouTube videos into text
Running on Zero

338

338

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

163

163

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Running on L4

653

653

OpenAudio S1

🏆

Generate speech from text
Running

445

445

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Paused

19

19

Diva Realtime Chat

🗣

Generate text responses from audio input
Running on Zero

2.65k

2.65k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Configuration error

260

260

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running

129

129

MelodyFlow

🎵

Generate music from text descriptions
Running on L40S

146

146

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

64

64

Nexa Omni Demo

🎧

Generate text from audio input
Running on Zero

2.99k

2.99k

Kokoro TTS

❤

Upgraded to v1.0!
Running

117

117

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running on Zero

310

310

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

12

12

Llasa 1b Multilingual TTS

🌍

Generate speech from text with or without cloning a voice
Running

344

344

Kokoro Text-to-Speech (WebGPU)

🗣

High-quality speech synthesis powered by Kokoro TTS
Running on Zero

MCP

42

42

Hibiki Simple

👄

High-Fidelity Simultaneous Speech-To-Speech Translation
Running on Zero

407

407

Zonos

🌍

Generate audio from text with customizable emotions and settings
Running

75

75

Kokoro Web

🗣

ML-powered speech synthesis directly in your browser
Running on Zero

644

644

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running

22

22

Audiobox Aesthetics

📚

Demo for audiobox-aesthetics
Running on Zero

229

229

Spark TTS

🌖

A text-to-speech model powered by SparkAudio and Mobvoi.
Running on Zero

844

844

Sesame CSM

🌱

Conversational speech generation
Running on Zero

238

238

Orpheus TTS

🚀

Try Orpheus TTS here
Running on Zero

42

42

Canary 1B Flash

🐤

Canary 1B Flash demo
Running on Zero

216

216

IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

🎙

Generate speech from text using a reference audio
Paused

6

6

AudioMorphix

🌊

Prepare environment and run Gradio app
Running on Zero

93

93

MegaTTS3 Demo

👋
Running on Zero

155

155

AudioX

👀

Generate audio from text and video prompts
Running on Zero

100

100

Vevo for Zero-shot VC, TTS, and More

🐠

Controllable Zero-Shot Voice Imitation
Running on Zero

1.7k

1.7k

Dia 1.6B

👯

Generate realistic dialogue from a script, using Dia!
Runtime error

43

43

Aero 1 Audio Demo

💬

Demo for Aero-1-Audio
Runtime error

44

44

Voila Demo

💻

Chat with a voice-clone AI
Running on Zero

589

589

ACE Step

😻

A Step Towards Music Generation Foundation Model
Running on Zero

2

2

Audio Difficulty Estimator

🎹

Estimate piano difficulty from audio
Running on Zero

MCP

105

105

TIGER Audio Extractor

✂

Extraction & Reconstruction for Efficient Speech Separation
Running on Zero

14

14

Music2emo

📊

Towards Unified Music Emotion Recognition across Dimensional
Runtime error

13

13

SonicVerse

🖼

Generate detailed music descriptions from audio clips
Running on Zero

MCP

39

39

Auffusion

😻

Audio Gen, Audio Style Transfer and Audio InPainting
Running on Zero

MCP

1.58k

1.58k

Chatterbox TTS

🍿

Expressive Zeroshot TTS
Running on L40S

117

117

PlayDiffusion

🎨

Generate modified audio from text and voice
Paused

2

2

Voice Clone Arena

🏆

Vote on the latest Voice Clone TTS models!
Running

219

219

Conversational WebGPU

🚀
Running on L40S

462

462

Song Generation

🎵

Generate a custom song from lyrics and optional prompts
Running on Zero

54

54

NotaGen

📊

Generate classical sheet music in ABC notation
Running on A100

81

81

Audio Flamingo 3 Demo

🚀

Audio Flamingo 3 Demo
Runtime error

33

33

Audio Flamingo 3 Chat

🐠

Audio Flamingo 3 demo for multi-turn multi-audio chat
Running on Zero

6

6

MSR UTMOS

🐢

Multiple sampling rate MOS prediction with SFI conv
Running on Zero

MCP

384

384

Higgs Audio Demo

🎤

Higgs Audio Demo
Running on Zero

15

15

sidon_demo_beta

🐋

Speech restoration demo of Sidon.
Running on Zero

65

65

Canary 1b V2

🐤

Transcribe and Translate in 25 European Languages
Running on Zero

17

17

SonicMaster – Text-Guided Music Restoration & Mastering

🎧

Enhance audio using text prompts
Runtime error

6

6

OLMoASR

🌍

Open Models and Data for Training Robust Speech Recognition
Running on Zero

85

85

VibeVoice-Large

🏃

Generate a podcast audio from a script and voice samples
Running on T4

10

10

TaDiCodec TTS AR Qwen2.5 0.5B

📚

Generate speech from text with voice cloning
Running on Zero

8

8

EchoX

🔥

An end-to-end speech large language model.
Running on Zero

43

43

VoxCPM 0.5B

🐢

Generate expressive speech from text with optional voice cloning
Running on Zero

34

34

FireRedTTS2

🔥

Long-form multi-speaker dialogue generation
Running on Zero

3

3

FireRedASR

🚀

FireRedASR Demo
Running on Zero

473

473

IndexTTS 2 Demo

🏢

Generate expressive speech from text with emotion control
Running on Zero

8

8

SongFormer

🎵

State-of-the-art music analysis with multi-scale datasets
Running on Zero

10

10

EmoAct MiMo

🎵

Controllable emotional TTS

Upvote

Collection guide
Browse collections

Whisper vs Distil-Whisper

Seamless M4T

MusicGen

Audioldm Text To Audio Generation

AudioLDM2 Text2Audio Text2Music Generation

AudioSep

Lp Music Caps

Tortoise Tts

All In One

XTTS

Coqui Bark Voice Cloning

VALL E X

WavJourney

Music To Image

MMS

ElevenLabs TTS

AudioGPT

Bark

SpeechT5 Speech Recognition Demo

CoquiTTS (Official)

Whisper

Moe TTS

YourTTS

Talking Face Generation with Multilingual TTS

OpenAI TTS New

Mustango

OWSM Demo

StyleTTS 2

HierSpeech++ (Zero-shot TTS)

Video2music

Whisper Large V2

Musicgen Prompt Upsampling

Seamless M4T v2

Seamless Streaming

Matcha TTS

MusicGen Streaming

Resemble Enhance

Singing Voice Conversion

NaturalSpeech2

Create Your Own TTS Dataset

Podcast Transcription

OpenVoice

M2UGen Demo

Pheme

ESPnet2 TTS

Whisper-WebUI

Image2SFX Comparison

WhisperSpeech

MetaVoice 1B

TTS Arena V2

Whisper Speech X DreamTalk

Canary 1b

SALMONN Audio Questioning

MeloTTS

Audio Editing

ChatMusician

xVASynth TTS

NaturalSpeech3 FACodec

Hey Gemma

Ratchet + Whisper

AutoSubs

VoiceCraft

TangoFlux

Parler-TTS

Sing an idea ➡️ Music

Musicgen Songstarter Demo

Whisper JAX

AudioLCM

Stable Audio Live Multiplayer

Stable Audio Open Zero

Make An Audio 3

Mars5 Space

Tango Music AF

Jam

BigVGAN

SenseVoice

PicoAudio

Audio Flamingo Demo

MusiConGen