Một prompt, ba việc. Ba việc đều mediocre.

Gom nhiều task vào một prompt nghe tiết kiệm. Thực ra bạn đang pha loãng sự tập trung — và output cuối thường tệ nhất.

Đọc4 phút đọc
Chủ đềprompt-design · quality · bundling · context
TL;DR

Gom ba task vào một prompt không tiết kiệm token — nó pha loãng sự tập trung. Agent tối ưu hóa cho mục tiêu đầu tiên, task sau nhận context còn lại. Kết quả: ba output đều mediocre thay vì một output tốt. Tách prompt khi chất lượng quan trọng hơn tiện lợi — và biết khi nào gom được mà không mất mát.

Có một buổi chiều tôi nhờ agent làm ba thứ cùng lúc: phân tích một bộ dữ liệu khách hàng, viết nháp email báo cáo, và rút ra điểm chính để trình bày.

Output về đủ cả ba. Phân tích thì có nhưng thiếu góc nhìn tôi cần. Email thì đủ ý nhưng thiếu nhịp. Tóm tắt thì… là tóm tắt của phần phân tích bên trên, không phải của vấn đề thật tôi muốn trình bày.

Tôi mất thêm một tiếng để làm lại từng phần.

Lần sau tôi gõ ba prompt riêng. Mỗi cái ra tốt hơn, và tổng thời gian ít hơn lần trước.

01Vì sao context bị pha loãng

Khi bạn đưa nhiều mục tiêu vào một prompt, agent không "làm cùng lúc" theo nghĩa song song. Nó xử lý tuần tự — từ đầu đến cuối prompt. Mục tiêu đầu tiên nhận đầy đủ sự chú ý. Mục tiêu thứ hai nhận context còn lại sau khi phần đầu đã tiêu hao. Mục tiêu thứ ba nhận phần còn lại của phần còn lại.

Thêm vào đó là vấn đề context contamination: nếu task đầu là phân tích số liệu, ngôn ngữ và frame phân tích đó sẽ ảnh hưởng lên task thứ hai. Bạn muốn email mang tone tích cực, nhưng agent vừa xong một buổi soi dữ liệu. Hai context xung đột, không ai thắng, output đứng ở giữa — không hẳn phân tích, không hẳn email.

Và có một thứ tinh tế hơn: khi bạn gom nhiều task, agent phải tự quyết định bao nhiêu là đủ cho từng task trước khi chuyển sang cái tiếp theo. Quyết định đó nó tự ra. Không phải bạn.

Ba prompt riêng

Mỗi prompt có đầy đủ context và mục tiêu duy nhất
Agent tối ưu hóa, không cân bằng — mỗi task nhận full effort
Output từng cái review độc lập: biết chỗ nào tốt, chỗ nào cần sửa

Ba task một prompt

Context bị chia sẻ, task sau nhận phần thừa
Agent cân bằng giữa các mục tiêu — không ai được full effort
Output gộp khó diagnose: không rõ phần nào yếu vì task nào thiệt

Nghịch lý: gom ba việc để tiết kiệm thì lại tốn hơn — vì thêm một vòng làm lại phần ra không đủ tốt. Ba prompt riêng thường nhanh hơn một prompt gộp cộng với rework sau đó.

02Dấu hiệu đang gom sai

Gom sai không phải lúc nào cũng rõ ngay khi nhận output. Đôi khi bạn chỉ phát hiện khi đem dùng và thấy thiếu. Bốn dấu hiệu:

Khi gộp task đang làm giảm chất lượng
Output cuối mỏng hoặc nhạt hơn hẳn output đầutask đầu nhận đủ sự tập trung, task sau nhận phần còn lại — không đều nhau trong cùng một prompt
Tone hoặc frame lệch nhau giữa các phầnagent bắt đầu với một giọng, chuyển sang task tiếp theo rồi mang frame cũ theo — hai phần không nhất quán mà bạn không rõ tại sao
Một task trong prompt bị hiểu lệch hoặc bị bỏ bớtkhi quá nhiều mục tiêu, agent tự đặt độ ưu tiên — không phải lúc nào cũng trùng với của bạn
Bạn không biết phần nào yếu khi review outputoutput gộp khó debug — không rõ vấn đề là ở prompt, ở task nào, hay ở thứ tự gộp

Cái cuối quan trọng nhất từ góc nhìn học: prompt một task cho feedback rõ — "task này agent không làm tốt". Prompt ba task cho feedback mơ — "cái này không ổn" — không biết cắm vào đâu để cải thiện.

03Khi nào gom được — khi nào phải tách

Không phải mọi gộp đều tệ. Có một đường phân khá rõ.

Gom được khi các task dùng cùng một context và output không cần độ chính xác cao ở từng phần riêng lẻ. Ví dụ: "tóm tắt bài này và rút ba điểm chính" — hai bước nhưng context hoàn toàn chồng nhau, cái sau là hệ quả tự nhiên của cái trước. Hay: "viết ngắn, giọng informal, hướng đến developer" — một task với nhiều constraint, không phải ba task.

Phải tách khi mỗi task cần một giọng khác, một cấp độ phân tích khác, hoặc khi output của nó sẽ được dùng độc lập. Nếu bạn cần phân tích tốt và email tốt và tóm tắt tốt — không phải phân-tích-đủ-ổn cộng email-đủ-ổn cộng tóm-tắt-đủ-ổn — tách ra.

Câu hỏi đơn giản nhất: nếu một trong ba phần ra yếu, tôi có phải làm lại cả ba không? Nếu có — đó là dấu hiệu chúng không thực sự là một việc. Tách ra để fail độc lập.

Một prompt, một việc không có nghĩa là phải gõ nhiều hơn. Nghĩa là khi output quan trọng, bạn kiểm soát được chính xác bao nhiêu tập trung đổ vào từng thứ. Và cái đó, khác với cảm giác, thường nhanh hơn một lần gộp rồi làm lại.

c
Người viết

Mỗi câu chuyện ở đây gói một bài học đã trả giá để học.

craftagentmột người vừa xây vừa học
40bài11cụmVI·ENsong ngữ