Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

205

Full-text search

Active filters: compression

cerebras/Qwen3-Coder-REAP-25B-A3B

Text Generation • Updated Oct 20 • 55.2k • 61

cerebras/GLM-4.5-Air-REAP-82B-A12B

Text Generation • 82B • Updated Oct 21 • 7.16k • 101

cerebras/Kimi-Linear-REAP-35B-A3B-Instruct

Text Generation • 35B • Updated Nov 6 • 1.47k • 58

apple/CLaRa-7B-Instruct

Updated 13 days ago • 162

apple/CLaRa-7B-E2E

Updated 16 days ago • 19

cerebras/DeepSeek-V3.2-REAP-345B-A37B

Text Generation • 345B • Updated 15 days ago • 1.75k • 27

cerebras/Qwen3-Coder-REAP-363B-A35B-FP8

Text Generation • 363B • Updated Oct 14 • 61 • 14

cerebras/Qwen3-Coder-REAP-246B-A35B-FP8

Text Generation • 246B • Updated Oct 14 • 72 • 18

cerebras/GLM-4.6-REAP-252B-A32B-FP8

Text Generation • 252B • Updated Oct 23 • 9.77k • 5

cerebras/Qwen3-Coder-REAP-246B-A35B

Text Generation • 246B • Updated Oct 30 • 27 • 5

unsloth/Qwen3-Coder-REAP-363B-A35B-GGUF

Text Generation • 363B • Updated Nov 5 • 1.83k • 8

cerebras/MiniMax-M2-REAP-172B-A10B

Text Generation • 173B • Updated Nov 15 • 706 • 16

cerebras/MiniMax-M2-REAP-139B-A10B

Text Generation • 139B • Updated Nov 17 • 885 • 18

apple/CLaRa-7B-Base

Updated 16 days ago • 14

RedHatAI/oBERT-teacher-squadv1

Updated Jul 31, 2022 • 24

RedHatAI/oBERT-12-downstream-pruned-unstructured-80-squadv1

Updated Jul 31, 2022 • 27

RedHatAI/oBERT-12-downstream-pruned-unstructured-90-squadv1

Updated Jul 31, 2022 • 36

RedHatAI/oBERT-12-downstream-pruned-unstructured-97-squadv1

Updated Jul 31, 2022 • 27

RedHatAI/oBERT-teacher-mnli

Updated Jul 31, 2022 • 25

RedHatAI/oBERT-12-downstream-pruned-unstructured-80-mnli

Updated Jul 31, 2022 • 32

RedHatAI/oBERT-12-downstream-pruned-unstructured-90-mnli

Updated Jul 31, 2022 • 32

RedHatAI/oBERT-12-downstream-pruned-unstructured-97-mnli

Updated Jul 31, 2022 • 18

RedHatAI/oBERT-teacher-qqp

Updated Jul 31, 2022 • 20

RedHatAI/oBERT-12-downstream-pruned-unstructured-80-qqp

Updated Jul 31, 2022 • 26

RedHatAI/oBERT-12-downstream-pruned-unstructured-90-qqp

Updated Jul 31, 2022 • 29

RedHatAI/oBERT-12-downstream-pruned-unstructured-97-qqp

Updated Jul 31, 2022 • 26

RedHatAI/oBERT-12-upstream-pretrained-dense

Updated Jul 31, 2022 • 23

RedHatAI/oBERT-6-upstream-pretrained-dense

Updated Jul 31, 2022 • 25

RedHatAI/oBERT-3-upstream-pretrained-dense

Updated Jul 31, 2022 • 32

RedHatAI/oBERT-12-upstream-pruned-unstructured-90

Updated Jul 31, 2022 • 23