Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

krishnateja95 updated a collection about 5 hours ago

HIGGS-per-tensor

krishnateja95 updated a collection about 5 hours ago

HIGGS-per-tensor

krishnateja95 updated a collection about 5 hours ago

HIGGS-per-tensor

View all activity

Collections 7

View 7 collections

models 315

inference-optimization/Qwen3-30B-A3B-7-bits-mode-noise-per-tensor

27B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-7-bits-mode-hybrid-per-tensor

27B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-7-bits-mode-heuristic-per-tensor

27B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-noise-per-tensor

25B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-hybrid-per-tensor

25B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-heuristic-per-tensor

25B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6-bits-mode-noise-per-tensor

23B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6-bits-mode-hybrid-per-tensor

23B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-6-bits-mode-heuristic-per-tensor

23B • Updated about 5 hours ago

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-noise-per-tensor

21B • Updated about 5 hours ago

View 315 models

datasets 9

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated 4 days ago • 80

inference-optimization/speculators_benchmarks_tool_call

Viewer • Updated 7 days ago • 4.9k • 61

inference-optimization/speculators-qwen3-30b-a3b-instruct-2507

Preview • Updated 15 days ago • 31

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated 27 days ago • 57

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated 27 days ago • 61

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

Updated Mar 19 • 53

inference-optimization/SWE-bench_Multilingual

Viewer • Updated Mar 10 • 300 • 20

inference-optimization/SWE-bench_Verified

Viewer • Updated Mar 10 • 500 • 54

inference-optimization/SWE-bench_Lite

Viewer • Updated Mar 10 • 323 • 24