Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model about 2 hours ago

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

MeganEFlynn updated a model 1 day ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

MeganEFlynn published a model 1 day ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

View all activity

Collections 5

View 5 collections

models 355

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

Text Generation • Updated about 2 hours ago • 171

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

4B • Updated 1 day ago • 13

inference-optimization/Qwen3-1.6B-A0.9B

Text Generation • 2B • Updated 1 day ago • 67

inference-optimization/gemma-4-1B-0.8B-tiny

1B • Updated 2 days ago • 10 • 1

inference-optimization/ctest-Qwen3.5-9B-subset-397-speculator.dflash

2B • Updated 6 days ago • 63

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w4a16

Text Generation • 32B • Updated 6 days ago • 183

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w8a8

Text Generation • 235B • Updated 6 days ago • 178

inference-optimization/Qwen3-235B-A22B-Instruct-2507-quantized.w4a16

Text Generation • 32B • Updated 6 days ago • 161

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 7 days ago • 129

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 7 days ago • 125

View 355 models

datasets 18

inference-optimization/Gemma4-Responses-Nemotron

Viewer • Updated 4 days ago • 762k • 43 • 1

inference-optimization/Longbench_Samples_Specdec

Viewer • Updated 6 days ago • 160 • 50

inference-optimization/ctest-subset-Qwen3.5-397B-A17B-FP8-dynamic-speculator-dataset

Viewer • Updated 7 days ago • 10k • 43

inference-optimization/final-ctest-Qwen3-8B-speculator-dataset

Viewer • Updated 13 days ago • 10k • 47

inference-optimization/updated-ctest-Qwen3-8B-speculator-dataset

Viewer • Updated 18 days ago • 10k • 54

inference-optimization/laguna-xs-ultrachat-responses

Viewer • Updated 27 days ago • 208k • 380

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated Apr 23 • 205k • 145

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated Apr 23 • 300k • 118

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated Apr 23 • 298k • 81

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated Apr 18 • 3.42k

View 18 datasets