Head-to-head

Grok 3 vs Imagen 4

Normalized scores are min-maxed per benchmark across all models we track (0–100). Open the interactive compare view to add benchmarks to the radar chart or pull in more models.

Interactive compare Grok 3 profile Imagen 4 profile

Grok 3

xAI

Imagen 4

Google

Benchmark	Grok 3	Imagen 4
Chatbot Arena Elo Arena		—
MMLU Pro MMLU-Pro		—
GPQA Diamond GPQA		—
MATH-500 MATH		—
AIME 2024 AIME		—
HumanEval HumanEval		—
IFEval IFEval		—
MMMU MMMU		—
MathVista MathVista		—
RULER 128k RULER		—
Image Arena Elo Img Arena	—
Prompt Adherence Prompt Fid.	—
Output Speed Speed		—
Time to First Token TTFT		—
FrontierMath Tiers 1-3 FrontierMath		—
OTIS Mock AIME 2024-2025 OTIS AIME		—
ARC-AGI 2 ARC-AGI 2		—
Aider Polyglot Aider		—
Frontier Composite Frontier		—

Methodology matches the main AI Model Analyzer About page.