Audio Tasks - a alecccdd Collection

alecccdd 's Collections

Fun

Impressive Large Models

Vision Tasks (Watermark)

Vision Tasks (Humans)

Vision Datasets

Vision Datasets (Human)

Diffusion Tasks

Text Generation

Text Datasets (Reasoning)

Text Datasets (Grammar)

ReID

small & highly efficient

Audio Tasks

updated 4 days ago

Soul-AILab/SoulX-Podcast-1.7B

Text-to-Speech • 2B • Updated Dec 18, 2025 • 416 • 231
bosonai/higgs-audio-v2-generation-3B-base

Text-to-Speech • 6B • Updated Jul 28, 2025 • 173k • 656
Running

32

Vocal Isolator

🗣

32

Isolate vocals from audio files
nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 4 days ago • 43.9k • 1.16k
FlashLabs/Chroma-4B

Any-to-Any • 6B • Updated 1 day ago • 5.78k • 256
Running on Zero

Featured

799

Qwen3-TTS Demo

🎙

799

Transform text into natural-sounding speech with custom voices
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

2B • Updated 4 days ago • 139k • 598