Yang Yang's picture

19

Yang Yang

yangyang14641

·

yangyang14641

AI & ML interests

None yet

Organizations

None yet

liked a model 8 months ago

mistralai/Mistral-Small-3.2-24B-Instruct-2506

24B • Updated Dec 22, 2025 • 180k • 560

liked a Space 11 months ago

The Ultra-Scale Playbook

The ultimate guide to training LLM on large GPU Clusters

liked 17 models about 1 year ago

deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27, 2025 • 486k • • 13k

hexgrad/Kokoro-82M

Text-to-Speech • Updated Apr 10, 2025 • 5.92M • • 5.68k

deepseek-ai/DeepSeek-Coder-V2-Instruct

Text Generation • 236B • Updated Aug 21, 2024 • 4.78k • 679

deepseek-ai/DeepSeek-Coder-V2-Lite-Base

Text Generation • 16B • Updated Jul 3, 2024 • 5.91k • 102

deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

Text Generation • 16B • Updated Jul 3, 2024 • 250k • • 537

deepseek-ai/DeepSeek-Coder-V2-Base

Text Generation • 236B • Updated Jul 3, 2024 • 224 • 82

deepseek-ai/DeepSeek-V3

Text Generation • 685B • Updated Mar 27, 2025 • 1.16M • • 4.02k

deepseek-ai/DeepSeek-V3-Base

685B • Updated Mar 27, 2025 • 1.21k • 1.68k

nvidia/OpenMath2-Llama3.1-70B

Text Generation • 71B • Updated Nov 25, 2024 • 626 • 21

nvidia/OpenMath2-Llama3.1-8B

Text Generation • 8B • Updated Nov 25, 2024 • 2.05k • • 32

nvidia/OpenMath2-Llama3.1-70B-nemo

Updated Nov 25, 2024 • 9

nvidia/OpenMath2-Llama3.1-8B-nemo

Updated Nov 25, 2024 • 6

TheBloke/Llama-2-7B-Chat-GGUF

Text Generation • 7B • Updated Oct 14, 2023 • 88.4k • 510

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13, 2025 • 16.8k • 2.06k

foduucom/stockmarket-pattern-detection-yolov8

Object Detection • Updated Apr 2, 2025 • 8.06k • 393

meta-llama/Llama-3.3-70B-Instruct

Text Generation • 71B • Updated Dec 21, 2024 • 957k • • 2.65k

openai/whisper-large-v3-turbo

Automatic Speech Recognition • 0.8B • Updated Oct 4, 2024 • 3.1M • • 2.81k