Claude Sonnet 5 Vừa Trở Thành Model Mặc Định Trong Claude Code — Hiệu Năng Coding Agentic Gần Bằng Opus Với Chưa Đến Nửa Giá

Những Con Số Mà Anthropic Vừa Đưa Ra

Vào ngày 30 tháng 6 năm 2026, Anthropic ra mắt Claude Sonnet 5, model Sonnet agentic nhất mà công ty từng phát hành, và đặt nó làm model mặc định cho mọi người dùng Free và Pro trên claude.ai ngay từ ngày ra mắt — cũng như model mặc định trong Claude Code cho bất kỳ ai chạy v2.1.197 trở lên. Con số mà developer thực sự quan tâm: Sonnet 5 đạt 63,2% trên SWE-bench Pro, tăng từ 58,1% của Sonnet 4.6, thu hẹp phần lớn khoảng cách với 69,2% của Opus 4.8 — trong khi ra mắt với giá giới thiệu $2 mỗi triệu token đầu vào và $10 mỗi triệu token đầu ra cho đến ngày 31 tháng 8 năm 2026 (sau đó tăng lên $3/$15), chỉ bằng một phần nhỏ chi phí mỗi token của Opus 4.8. Với một model giờ đây chạy mặc định trên các bề mặt Claude có lưu lượng cao nhất, sự kết hợp đó — hiệu năng coding gần bằng flagship với giá mid-tier — mới chính là câu chuyện thực sự.

Context Window Đầy Đủ 1 Triệu Token, Không Phụ Phí Long-Context

Context window ra mắt ở mức 1 triệu token trên API với output tối đa 128K, và — đáng chú ý — không có phụ phí long-context riêng như một số tier trước đây từng tính thêm khi cuộc hội thoại vượt qua một ngưỡng độ dài nhất định. Với các workflow agentic đọc toàn bộ repository, diff nhiều file, hoặc transcript tool-call dài trước khi tạo ra một chỉnh sửa duy nhất, đây là một thay đổi vận hành có ý nghĩa: chi phí của một request không còn tăng vọt chỉ vì context của bạn vượt qua 200K token. Kết hợp với cấu hình high-effort mặc định mà Sonnet 5 chạy trên cả API và Claude Code, đây là một model được tinh chỉnh dành riêng cho các vòng lặp agent nhiều bước, sử dụng tool, tự sửa lỗi, thay vì các chat completion một lượt.

Nó Thực Sự Thắng Ở Đâu — Và Opus 4.8 Vẫn Dẫn Đầu Ở Đâu

Bộ benchmark mà chính Anthropic công bố vẽ ra một bản đồ chính xác về vị trí của Sonnet 5. Trên Terminal-Bench 2.1, một đánh giá coding trong terminal, Sonnet 5 đạt 80,4% so với 67,0% của Sonnet 4.6 và 82,7% của Opus 4.8 — gần như đóng hoàn toàn khoảng cách đó. Trên OSWorld-Verified, một benchmark computer-use kiểm tra liệu model có thể vận hành giao diện GUI để hoàn thành tác vụ hay không, Sonnet 5 đạt 81,2%, tăng từ 78,5%. Trên GDPval-AA v2, một benchmark công việc tri thức, Sonnet 5 thậm chí đạt điểm cao hơn Opus 4.8 — 1.618 so với 1.615. Mô hình xuất hiện xuyên suốt cả bốn benchmark được công bố là nhất quán: Sonnet 5 không đánh bại Opus 4.8 ở những tác vụ coding agentic khó nhất, nhưng nó đủ gần, trên đủ nhiều loại tác vụ, để chênh lệch giá trở thành yếu tố quyết định với phần lớn workload production.

Tại Sao Lại Giảm Giá Chính Model Gần-Flagship Của Mình Ngay Lúc Này

Thời điểm này không phải ngẫu nhiên. Anthropic đã nộp hồ sơ bảo mật lên SEC vào ngày 1 tháng 6 năm 2026 cho một đợt IPO được cho là nhắm đến mức định giá gần 1 nghìn tỷ đô la, và mỗi lần ra mắt sản phẩm từ giờ đến IPO đó đều đóng vai trò, một phần, như bằng chứng cho nhà đầu tư đại chúng: tăng trưởng doanh thu, con đường khả thi đến lợi nhuận, và bằng chứng rằng khách hàng doanh nghiệp thực sự ưa chuộng model của Anthropic hơn đối thủ. OpenAI — công ty đã huy động 122 tỷ đô la vào tháng 3 với định giá 852 tỷ đô la và đang triển khai GPT-5.6 theo từng giai đoạn dưới áp lực của chính phủ Mỹ — cũng đang theo đuổi cùng ngân sách doanh nghiệp đó, cùng với Google và Meta. Giảm giá mạnh cho một bản phát hành mid-tier gần-flagship so với chính model cao cấp nhất của mình là cách để giành khối lượng sử dụng và dữ liệu usage trước roadshow IPO, ngay cả khi điều đó làm giảm biên lợi nhuận trên giấy tờ — một chiến lược chỉ hiệu quả nếu developer thực sự áp dụng model rẻ hơn vào production, và đó chính xác là điều mà việc đặt nó làm mặc định trong Claude Code và claude.ai được thiết kế để thúc đẩy.

Việc Thực Sự Cần Làm

Nếu team của bạn đang chạy workflow agentic trên Sonnet 4.6 ngày hôm nay, đường nâng cấp gần như miễn phí: cùng bề mặt API, cùng giao diện sử dụng tool, benchmark tốt hơn, giá niêm yết thấp hơn trong thời gian giới thiệu, và không cần hành động gì nếu bạn đã ghim vào alias chung "sonnet" thay vì một chuỗi model theo ngày cụ thể. Người dùng Claude Code cần v2.1.197 trở lên để có Sonnet 5 làm mặc định; các team dùng gói Team hay Enterprise nên xác nhận chính sách tổ chức của mình đang ghim model nào trước khi giả định rằng mọi người đã tự động được nâng cấp. Quyết định quan trọng hơn là liệu điểm SWE-bench Pro và Terminal-Bench 2.1 của Sonnet 5 đã đủ gần Opus 4.8 để các workload hiện đang định tuyến đến Opus vì lý do chất lượng nên chuyển xuống Sonnet 5 vì lý do chi phí hay chưa — đây là một đánh giá theo từng workload, không phải một sự chuyển đổi hàng loạt, và đáng để chạy lại bộ eval của riêng bạn thay vì chỉ tin vào các con số đã công bố.

Kết Luận

Claude Sonnet 5 không phải là một bản cập nhật nhỏ lẻ. Đây là câu trả lời của Anthropic cho câu hỏi bạn có thể nhận được bao nhiêu năng lực agentic với mức giá mid-tier — và câu trả lời, đo lường qua bốn benchmark được công bố độc lập, là: gần như toàn bộ. Việc ra mắt như model mặc định trong Claude Code và claude.ai ngay từ ngày đầu có nghĩa là phần lớn lưu lượng developer của Anthropic giờ đây chạy qua model này mà không ai cần phải chủ động chọn. Với developer và AI engineer đang quyết định xây dựng agent trên nền tảng nào cho nửa cuối năm 2026, bài học thực tế rất đơn giản: hãy chạy lại eval của bạn trên Sonnet 5 trước khi tiếp tục trả giá Opus 4.8 cho những workload mà giờ đây Sonnet 5 có thể xử lý tốt tương đương.