Inference Optimization

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

krishnateja95 updated a collection about 7 hours ago

Qwen3-Next-80B-A3B-Instruct Quantized Models

krishnateja95 updated a collection about 7 hours ago

Qwen3-Next-80B-A3B-Instruct Quantized Models

krishnateja95 updated a collection about 7 hours ago

Qwen3-Next-80B-A3B-Instruct Quantized Models

View all activity

Collections 3

View 3 collections

models 30

datasets 0

None public yet

Inference Optimization

AI & ML interests

Recent Activity

Collections 3

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w8a8

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w4a16

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-block

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-dynamic

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-out_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-qkv_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-down_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-gate_up_proj-all

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w8a8

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w4a16

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-block

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-dynamic

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-out_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-qkv_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-down_proj-all

inference-optimization/Llama-3.1-8B-Instruct-Mixed-NVFP4-FP8_BLOCK-gate_up_proj-all

models 30

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w8a8

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w4a16

inference-optimization/Qwen3-Next-80B-A3B-Instruct-NVFP4

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-dynamic

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-block

inference-optimization/Qwen3-30B-A3B-Thinking-2507.w4a16

inference-optimization/Llama-3.1-8B-Instruct-HIGGS-quantized-paths

inference-optimization/Qwen3-30B-A3B-Instruct-2507.w4a16

inference-optimization/Qwen3-4B-Instruct-2507.w4a16

inference-optimization/Qwen3-4B-Thinking-2507.w4a16

datasets 0

AI & ML interests

Recent Activity

Team members 12

Collections 3

models 30 Sort: Recently updated

datasets 0

models 30