Có một buổi chiều tôi nhờ agent làm ba thứ cùng lúc: phân tích một bộ dữ liệu khách hàng, viết nháp email báo cáo, và rút ra điểm chính để trình bày.
Output về đủ cả ba. Phân tích thì có nhưng thiếu góc nhìn tôi cần. Email thì đủ ý nhưng thiếu nhịp. Tóm tắt thì… là tóm tắt của phần phân tích bên trên, không phải của vấn đề thật tôi muốn trình bày.
Tôi mất thêm một tiếng để làm lại từng phần.
Lần sau tôi gõ ba prompt riêng. Mỗi cái ra tốt hơn, và tổng thời gian ít hơn lần trước.
01Vì sao context bị pha loãng
Khi bạn đưa nhiều mục tiêu vào một prompt, agent không "làm cùng lúc" theo nghĩa song song. Nó xử lý tuần tự — từ đầu đến cuối prompt. Mục tiêu đầu tiên nhận đầy đủ sự chú ý. Mục tiêu thứ hai nhận context còn lại sau khi phần đầu đã tiêu hao. Mục tiêu thứ ba nhận phần còn lại của phần còn lại.
Thêm vào đó là vấn đề context contamination: nếu task đầu là phân tích số liệu, ngôn ngữ và frame phân tích đó sẽ ảnh hưởng lên task thứ hai. Bạn muốn email mang tone tích cực, nhưng agent vừa xong một buổi soi dữ liệu. Hai context xung đột, không ai thắng, output đứng ở giữa — không hẳn phân tích, không hẳn email.
Và có một thứ tinh tế hơn: khi bạn gom nhiều task, agent phải tự quyết định bao nhiêu là đủ cho từng task trước khi chuyển sang cái tiếp theo. Quyết định đó nó tự ra. Không phải bạn.
✓ Ba prompt riêng
✕ Ba task một prompt
Nghịch lý: gom ba việc để tiết kiệm thì lại tốn hơn — vì thêm một vòng làm lại phần ra không đủ tốt. Ba prompt riêng thường nhanh hơn một prompt gộp cộng với rework sau đó.
02Dấu hiệu đang gom sai
Gom sai không phải lúc nào cũng rõ ngay khi nhận output. Đôi khi bạn chỉ phát hiện khi đem dùng và thấy thiếu. Bốn dấu hiệu:
Cái cuối quan trọng nhất từ góc nhìn học: prompt một task cho feedback rõ — "task này agent không làm tốt". Prompt ba task cho feedback mơ — "cái này không ổn" — không biết cắm vào đâu để cải thiện.
03Khi nào gom được — khi nào phải tách
Không phải mọi gộp đều tệ. Có một đường phân khá rõ.
Gom được khi các task dùng cùng một context và output không cần độ chính xác cao ở từng phần riêng lẻ. Ví dụ: "tóm tắt bài này và rút ba điểm chính" — hai bước nhưng context hoàn toàn chồng nhau, cái sau là hệ quả tự nhiên của cái trước. Hay: "viết ngắn, giọng informal, hướng đến developer" — một task với nhiều constraint, không phải ba task.
Phải tách khi mỗi task cần một giọng khác, một cấp độ phân tích khác, hoặc khi output của nó sẽ được dùng độc lập. Nếu bạn cần phân tích tốt và email tốt và tóm tắt tốt — không phải phân-tích-đủ-ổn cộng email-đủ-ổn cộng tóm-tắt-đủ-ổn — tách ra.
Câu hỏi đơn giản nhất: nếu một trong ba phần ra yếu, tôi có phải làm lại cả ba không? Nếu có — đó là dấu hiệu chúng không thực sự là một việc. Tách ra để fail độc lập.
Một prompt, một việc không có nghĩa là phải gõ nhiều hơn. Nghĩa là khi output quan trọng, bạn kiểm soát được chính xác bao nhiêu tập trung đổ vào từng thứ. Và cái đó, khác với cảm giác, thường nhanh hơn một lần gộp rồi làm lại.