Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

242

Base only

Active filters: cuda

prism-ml/Bonsai-8B-gguf

Text Generation • 8B • Updated Apr 18 • 18.1k • 726

ussoewwin/Flash-Attention-2_for_Windows

Updated 3 days ago • 112

nvidia/CUDA-Autocomplete

Text Generation • 8B • Updated 16 days ago • 232 • 16

prism-ml/bonsai-image-ternary-4B-gemlite-2bit

Text-to-Image • Updated 22 days ago • 1.91k • 119

Multilingual-Multimodal-NLP/IndustrialCoder

Text Generation • 32B • Updated Mar 27 • 106 • 65

prism-ml/Bonsai-4B-gguf

Text Generation • 4B • Updated Apr 18 • 9.88k • 49

prism-ml/Bonsai-1.7B-gguf

Text Generation • 2B • Updated Apr 18 • 6.24k • 76

prism-ml/bonsai-image-binary-4B-gemlite-1bit

Text-to-Image • Updated 22 days ago • 280 • 41

thad0ctor/torch2.12-cu133-cp312-wheels

Updated 9 days ago • 1

elinas/chronos-13b-4bit

Text Generation • Updated Jun 23, 2023 • 29 • 23

CalderaAI/13B-Ouroboros-GPTQ4bit-128g-CUDA

Text Generation • Updated Jul 20, 2023 • 14

marcorez8/llama-cpp-python-windows-blackwell-cuda

Updated Jun 2, 2025 • 4

Prince-1/sarvam-m-onnx

Updated Jun 14, 2025 • 1

ValiantLabs/Qwen3-8B-ShiningValiant3

Text Generation • 8B • Updated Dec 9, 2025 • 20 • 3

mradermacher/Qwen3-8B-ShiningValiant3-GGUF

8B • Updated Jul 8, 2025 • 875 • 2

mradermacher/Qwen3-8B-ShiningValiant3-i1-GGUF

8B • Updated Jul 11, 2025 • 265 • 2

ValiantLabs/Qwen3-1.7B-ShiningValiant3

Text Generation • 2B • Updated Dec 9, 2025 • 18 • • 5

mradermacher/Qwen3-1.7B-ShiningValiant3-GGUF

2B • Updated Jul 11, 2025 • 77

mradermacher/Qwen3-1.7B-ShiningValiant3-i1-GGUF

2B • Updated Jul 11, 2025 • 318

ValiantLabs/Qwen3-4B-ShiningValiant3

Text Generation • 4B • Updated Dec 9, 2025 • 55 • • 7

sequelbox/Qwen3-8B-PlumEsper

Text Generation • 8B • Updated Jul 14, 2025 • 4

sequelbox/Qwen3-4B-PlumEsper

Text Generation • 4B • Updated Jul 15, 2025 • 7

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-GGUF

3B • Updated Jul 27, 2025 • 175 • 1

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-GGUF

2B • Updated Jul 27, 2025 • 65

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-GGUF

2B • Updated Jul 27, 2025 • 59

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-i1-GGUF

2B • Updated Dec 18, 2025 • 246

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-i1-GGUF

2B • Updated Dec 18, 2025 • 107

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-i1-GGUF

3B • Updated Dec 18, 2025 • 187 • 1

mradermacher/Qwen3-Shining-Valiant-Instruct-Fast-CODER-Reasoning-2.4B-GGUF

2B • Updated Jul 31, 2025 • 85

mradermacher/Qwen3-Shining-Valiant-Instruct-Fast-CODER-Reasoning-2.4B-i1-GGUF

2B • Updated Dec 25, 2025 • 191