Models

402

Full-text search

Active filters: audio-text-to-text

nvidia/audio-flamingo-next-hf

Audio-Text-to-Text • 8B • Updated 3 days ago • 7.72k • 52

nvidia/audio-flamingo-next-captioner-hf

Audio-Text-to-Text • 8B • Updated 3 days ago • 3k • 18

microsoft/VibeVoice-ASR-HF

Audio-Text-to-Text • 8B • Updated Mar 9 • 292k • 131

google/gemma-3n-E2B-it

Image-Text-to-Text • Updated Jul 14, 2025 • 458k • 300

mistralai/Voxtral-Small-24B-2507

Audio-Text-to-Text • 24B • Updated Dec 20, 2025 • 49.5k • 495

nvidia/audio-flamingo-3-hf

Audio-Text-to-Text • 8B • Updated Apr 13 • 191k • 185

nvidia/music-flamingo-hf

Audio-Text-to-Text • 8B • Updated Apr 4 • 16.1k • 97

stepfun-ai/Step-Audio-R1.1

Audio-Text-to-Text • 33B • Updated Feb 14 • 460 • 179

nvidia/audio-flamingo-next-think-hf

Audio-Text-to-Text • 8B • Updated 3 days ago • 5.47k • 8

OpenMOSS-Team/MOSS-Music-8B-Thinking

Audio-Text-to-Text • 9B • Updated 15 days ago • 92 • 20

Qwen/Qwen-Audio-Chat

Text Generation • 8B • Updated Jan 12, 2025 • 76.8k • 96

NexaAI/OmniAudio-2.6B

Audio-Text-to-Text • 3B • Updated Dec 13, 2024 • 945 • 289

ggml-org/ultravox-v0_5-llama-3_2-1b-GGUF

Audio-Text-to-Text • 1B • Updated May 25, 2025 • 7.72k • 7

google/gemma-3n-E4B-it

Image-Text-to-Text • Updated Jul 14, 2025 • 37.3k • • 913

mispeech/midashenglm-7b-1021-fp8

Audio-Text-to-Text • 8B • Updated Oct 31, 2025 • 128 • 5

mispeech/midashenglm-7b-1021-fp32

Audio-Text-to-Text • 8B • Updated Oct 31, 2025 • 46 • 2

fixie-ai/ultravox-v0_7-glm-4_6

Audio-Text-to-Text • 0.7B • Updated Dec 8, 2025 • 10.3k • 27

Vikhrmodels/Borealis-5b-it

Audio-Text-to-Text • Updated Dec 19, 2025 • 73 • 13

nvidia/music-flamingo-2601-hf

Audio-Text-to-Text • 8B • Updated Apr 9 • 113k • 100

ACE-Step/acestep-transcriber

Audio-Text-to-Text • Updated Feb 3 • 10.2k • 57

OpenMOSS-Team/MOSS-Audio-4B-Instruct

Audio-Text-to-Text • 5B • Updated Apr 14 • 30.7k • 52

OpenMOSS-Team/MOSS-Audio-8B-Instruct

Audio-Text-to-Text • 9B • Updated Apr 14 • 1.81k • 38

OpenMOSS-Team/MOSS-Audio-8B-Thinking

Audio-Text-to-Text • 9B • Updated Apr 14 • 42.5k • 62

RumiLabs/MOSS-Audio-4B-Thinking-MLX-4bit

Audio-Text-to-Text • Updated 7 days ago • 1

fixie-ai/ultravox-v0_5-llama-3_2-1b

Audio-Text-to-Text • 0.7B • Updated Mar 11 • 927k • 79

Qwen/Qwen-Audio

Text Generation • 8B • Updated Nov 20, 2024 • 1.95k • 148

fixie-ai/ultravox-v0_2

Audio-Text-to-Text • 8B • Updated May 6, 2025 • 1.15k • 51

Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • Updated Nov 20, 2024 • 8.79k • 170

fixie-ai/ultravox-v0_3

Audio-Text-to-Text • 8B • Updated May 6, 2025 • 1.41k • 17

Qwen/Qwen2-Audio-7B-Instruct

Audio-Text-to-Text • Updated Jan 12, 2025 • 495k • 530