MJ-Bench-Offical's picture

4 3

MJ-Bench-Offical

MJ-Bench-Offical

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 months ago

Scaling Agent Learning via Experience Synthesis

liked a dataset 9 months ago

Zhaorun/SafeWatch-Bench

liked a dataset 9 months ago

Zhaorun/SafeWatch-Bench-200K

View all activity

Organizations

upvoted a paper 2 months ago

Scaling Agent Learning via Experience Synthesis

Paper • 2511.03773 • Published Nov 5, 2025 • 81

liked 2 datasets 9 months ago

Zhaorun/SafeWatch-Bench

Viewer • Updated Feb 10, 2025 • 1.4k • 191 • 11

Zhaorun/SafeWatch-Bench-200K

Viewer • Updated Apr 6, 2025 • 161k • 29 • 3

upvoted a paper 9 months ago

ShieldAgent: Shielding Agents via Verifiable Safety Policy Reasoning

Paper • 2503.22738 • Published Mar 26, 2025 • 17

upvoted a paper over 1 year ago

AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases

Paper • 2407.12784 • Published Jul 17, 2024 • 51

liked a Space over 1 year ago

MJ Bench Leaderboard

Display and filter multimodal model leaderboard results

upvoted a paper over 1 year ago

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

Paper • 2407.04842 • Published Jul 5, 2024 • 55