Claude 'Dreaming' Không Phải Chiêu Trò: Cách Memory Agent Mới Của Anthropic Sửa Lỗi AI Production

Ngày 6/5/2026, Anthropic tổ chức hội nghị developer Code with Claude tại San Francisco và công bố ba tính năng mới cho Claude Managed Agents: Dreaming, Outcomes và Multiagent Orchestration. Mỗi tính năng giải quyết một lỗi khác nhau mà các team thường gặp phải khi cố đưa AI agent từ demo sang môi trường production thực tế. Kết hợp lại, chúng đại diện cho một sự thay đổi kiến trúc quan trọng trong cách Anthropic nghĩ về các hệ thống agentic chạy dài hạn — và đi kèm với các con số production cụ thể từ các công ty đã triển khai.

Dreaming — Bộ Nhớ Agent Tự Cải Thiện Qua Đêm

Tên nghe có vẻ lạ nhưng cơ chế rất chính xác. Dreaming là một tiến trình nền chạy theo lịch giữa các phiên agent. Nó đọc qua log có cấu trúc và memory store từ các lần chạy trước, xác định các pattern trong đó, và tổ chức lại những gì được ghi vào memory cho phiên tiếp theo. Quan trọng là nó không thay đổi trọng số mô hình — nó chỉ tổ chức lại context.

Tiến trình tìm kiếm ba loại tín hiệu: những lỗi lặp đi lặp lại mà agent liên tục mắc phải, các workflow mà agent thường hội tụ đến qua các task khác nhau, và những sở thích nhất quán xuất hiện trong cả một nhóm agent. Sau khi xác định các pattern này, nó hợp nhất các mục nhớ trùng lặp, xóa bỏ context lỗi thời, và viết lại memory store ở trạng thái sạch hơn, tín hiệu cao hơn trước khi phiên tiếp theo bắt đầu. Nó phát hiện ra những insight mà không phiên đơn lẻ nào có thể nhìn thấy.

Tác động thực tế đã có thể đo lường được. Harvey — công ty AI pháp lý — báo cáo tỷ lệ hoàn thành task tăng khoảng 6 lần sau khi triển khai Dreaming. Các agent giờ đây ghi nhớ các cách xử lý khó khăn cho loại file cụ thể và các hành vi công cụ mà trước đây phải khám phá lại từ đầu mỗi phiên. Một chi phí học tập theo từng phiên đã biến thành khám phá một lần duy nhất.

Một giới hạn cần biết: Dreaming hiện chỉ có trong research preview cho Claude Managed Agents. Không thể truy cập qua Messages API tiêu chuẩn. Nếu bạn đang xây dựng trên raw API, tính năng này chưa áp dụng cho stack hiện tại — nhưng nó cho thấy hướng phát triển của nền tảng.

Multiagent Orchestration — Agent Song Song Với Reasoning Có Thể Truy Vết

Multiagent Orchestration cho phép một lead agent phân tách task phức tạp thành các subtask và định tuyến từng subtask đến một sub-agent chuyên biệt. Mỗi sub-agent có model riêng, system prompt riêng, bộ công cụ riêng và context window độc lập. Lead agent điều phối workflow và tổng hợp kết quả. Mỗi bước — agent nào làm gì, theo thứ tự nào, và vì sao — đều có thể truy vết đầy đủ trong Claude Console.

Lựa chọn thiết kế then chốt ở đây là sự cô lập. Thay vì tải toàn bộ độ phức tạp của task lớn vào một context window duy nhất, orchestrator phân tách nó và cung cấp cho mỗi sub-agent phạm vi tập trung, rõ ràng. Anthropic cho biết cách này cho kết quả tốt hơn đáng kể so với phương pháp single-agent, long-context cho các task có subtask có thể tách biệt. Logic định tuyến giới thiệu độ trễ và chi phí điều phối — với task hoàn toàn tuyến tính, single-agent vẫn nhanh hơn.

Outcomes — Dạy Agent Hiểu 'Tốt' Là Gì

Outcomes là một grader có cấu trúc gắn với vòng lặp thực thi của agent. Bạn định nghĩa một lần chạy thành công trông như thế nào, và agent có tín hiệu phản hồi cụ thể để đánh giá khi quyết định lặp lại hay kết thúc. Điều này chuyển agent từ 'thực hiện các bước này' sang 'đạt được kết quả này' — một khung lệnh mạnh mẽ hơn căn bản cho các workflow phức tạp, biến đổi.

Các con số production rất cụ thể. Wisedocs — công ty xem xét tài liệu y tế — cắt giảm 50% thời gian xem xét sau khi triển khai Outcomes. Trong các bài đánh giá nội bộ của Anthropic, Outcomes cải thiện tỷ lệ thành công task lên tới 10 điểm phần trăm. Cơ chế rất đơn giản: agent làm tốt nhất khi chúng biết mình đang cố đạt được gì, không chỉ là thực hiện những bước nào.

Ý Nghĩa Với Production Engineering

Ba tính năng này giải quyết một vấn đề cụ thể: các agent hoạt động tốt trong demo nhưng xuống cấp theo thời gian trong production. Không có memory curation, agent tích lũy context lỗi thời. Không có orchestration, agent thất bại ở ranh giới context window. Không có outcome grader, agent kết thúc tùy tiện hoặc cần con người can thiệp để nhận ra lỗi. Đây không phải edge case — đây là ba cách phổ biến nhất mà các triển khai agent production hoạt động dưới kỳ vọng.

Tín hiệu kinh doanh đằng sau những tính năng này khó bỏ qua. Claude Code — coding agent gốc terminal của Anthropic — vượt 2,5 tỷ USD ARR vào tháng 2/2026. ARR tổng của Anthropic đạt 30 tỷ USD vào tháng 4, tăng từ 1 tỷ USD vào tháng 12/2024. Sự tăng trưởng đó được thúc đẩy gần như hoàn toàn bởi việc developer áp dụng agentic workflow. Dreaming, Outcomes và Multiagent Orchestration là cơ sở hạ tầng Anthropic đang xây để giữ sự áp dụng đó khi các team chuyển từ thử nghiệm sang production.

Nếu bạn đang xây dựng với Claude Managed Agents hôm nay, danh sách kiểm tra thực tế rất ngắn: đặt thiết bị các phiên để Dreaming có log hữu ích để học, định nghĩa tiêu chí Outcomes trước khi triển khai thay vì sau lỗi đầu tiên, và đánh giá xem workflow của bạn có thực sự có các subtask có thể tách biệt không trước khi giới thiệu chi phí multiagent. Các tính năng này phát huy tác dụng tốt nhất với những team đã tư duy rõ ràng về agent cần đạt được gì.

Sự Thay Đổi Lớn Hơn

Điều mà Dreaming, Outcomes và Multiagent Orchestration có chung là một triết lý thiết kế: AI agent không phải là công cụ một lần. Chúng là các hệ thống chạy dài hạn đòi hỏi cùng kỷ luật kỹ thuật như bất kỳ phần mềm production nào khác — tiêu chí thành công rõ ràng, hành vi có thể quan sát, và cơ chế cải thiện theo thời gian. Anthropic đang xây dựng cơ sở hạ tầng đó vào nền tảng. Dù bạn có áp dụng Claude Managed Agents hay không, mô hình tư duy này đáng được áp dụng: agent của bạn không phải là một function call. Nó là một service. Và service cần được xây dựng để bền vững.