So sánh Claude Sonnet 4.6 vs GPT-5.4: AI nào mạnh hơn cho coding?

Benchmark mới nhất cho thấy Claude Sonnet 4.6 dẫn đầu SWE-bench với 76.8% vs GPT-5.4 ở 74%. Claude cũng dẫn đầu GDPval-AA Elo cho công việc văn phòng chuyên gia.

Cuộc đua coding AI nóng hơn bao giờ hết

Trong các benchmark mới nhất tháng 3/2026, Claude Sonnet 4.6 tiếp tục khẳng định vị thế dẫn đầu cho coding với điểm SWE-bench đạt 76.8%, vượt GPT-5.4 ở mức 74%.

Hiệu suất thực tế

Trên bảng xếp hạng GDPval-AA Elo — thước đo khả năng xử lý công việc văn phòng cấp chuyên gia — Claude Sonnet 4.6 đạt 1,633 điểm, đánh bại cả Opus 4.6 và Gemini 3.1 Pro. Đáng chú ý, Sonnet 4.6 cung cấp hiệu suất gần bằng Opus nhưng với mức giá Sonnet.

Đối thủ mới: MiniMax M2.5

MiniMax M2.5 cũng gây bất ngờ khi đạt hiệu suất ngang Claude Opus 4.6 với chi phí thấp hơn đáng kể, tạo thêm áp lực cạnh tranh trong thị trường AI.

GPT-5.4 mini miễn phí

OpenAI phản công bằng cách cung cấp GPT-5.4 mini miễn phí cho tất cả người dùng, đồng thời khai tử Sora để chuyển compute sang robotics — một bước đi táo bạo.

Nên chọn gì?

Nếu ưu tiên coding và content chất lượng cao, Claude Max 20x vẫn là lựa chọn tốt nhất hiện tại với context 1M token và hiệu suất dẫn đầu. Xem các gói tại shop →