Audio Tasks - a alecccdd Collection

alecccdd 's Collections

Impressive Large Models

Vision Tasks (Watermark)

Vision Tasks (Humans)

Vision Datasets

Vision Datasets (Human)

Diffusion Tasks

Text Generation

Text Datasets (Reasoning)

Text Datasets (Grammar)

small & highly efficient

Audio Tasks

updated 11 days ago

Soul-AILab/SoulX-Podcast-1.7B

Text-to-Speech • Updated Dec 18, 2025 • 276 • 231
bosonai/higgs-audio-v2-generation-3B-base

Text-to-Speech • Updated Jul 28, 2025 • 199k • 658
Running

32

Vocal Isolator

🗣

32

Isolate vocals from audio files
nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 9 days ago • 539k • 2.18k
FlashLabs/Chroma-4B

Any-to-Any • Updated 27 days ago • 6.82k • 336
Running on Zero

Featured

1.52k

Qwen3-TTS Demo

🎙

1.52k

Generate custom speech from text, voice descriptions, or samples
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • Updated 26 days ago • 1.02M • 1.17k
ACE-Step/acestep-v15-base

Text-to-Audio • 2B • Updated 18 days ago • 7.89k • 50
kugelaudio/kugelaudio-0-open

Text-to-Speech • Updated 18 days ago • 92.8k • 164
OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated 11 days ago • 58.4k • 316