Bạn nhờ agent viết một bản phân tích. Nó trả về chín trang, có bảng biểu, có bullet, trông như thứ bạn mất nửa ngày mới làm ra.
Bạn lướt qua. Trông ổn. Gửi đi.
Ba ngày sau khách phát hiện một con số trong bảng tóm tắt bị tính sai — cách tính đúng là logic khác hẳn. Bạn phải viết lại phần đó, giải thích với khách, và mất thêm một buổi làm việc để patch lại những chỗ khác có dùng con số kia.
Tổng cộng là bao nhiêu? Không phải thời gian đọc lại chín trang ban đầu — vì bạn đã không đọc. Là thời gian viết lại + giải thích + patch + chi phí niềm tin đã mất một phần. Tất cả đến từ một lỗi mà nếu phát hiện ban đầu thì sửa trong năm phút.
01Chi phí tăng theo khoảng cách phát hiện
Cùng một lỗi, ba chi phí hoàn toàn khác nhau. Biến kiểm soát duy nhất là khoảng cách giữa lúc lỗi xảy ra và lúc bạn phát hiện — và khoảng cách đó hoàn toàn nằm trong tay bạn.
Nguyên lý này không mới. Trong phát triển phần mềm, người ta biết từ lâu: bug được bắt trong code review rẻ hơn nhiều bug được bắt ở staging, và cả hai rẻ hơn nhiều bug đến production. Với agent output, nguyên lý y hệt — chỉ là nó ít hiển nhiên hơn vì output trông pro và ít lúc nào gây ra lỗi rõ ràng ngay lập tức.
02Output nào có rủi ro phát hiện muộn cao nhất
Không phải mọi output đều bình đẳng. Bốn loại này thường là nguồn của những lỗi phát hiện muộn và đắt tiền nhất:
Output trông pro không phải dấu hiệu của output đúng. Đôi khi là ngược lại — output sai nhưng được viết tốt dễ lọt qua hơn output sai mà trông sai.
03Hai câu để đóng khoảng cách ngay tại nguồn
Cách rẻ nhất để giảm chi phí lỗi không phải review kỹ hơn sau khi nhận output. Là cho agent biết trước điều kiện verify — để nó tự flag nghi vấn trước khi bạn phải tìm:
"Trong output, đánh dấu [CHECK] vào bất kỳ chỗ nào bạn không chắc chắn hoặc cần tôi xác nhận thêm. Đừng để những phần đó trông giống như phần chắc chắn."
"Sau phần output, liệt kê ngắn các giả định quan trọng bạn đã dùng để tạo ra kết quả này. Nếu giả định sai, output sẽ sai theo cách nào?"
Hai câu này làm một việc quan trọng: biến lỗi im lặng thành lỗi có nhãn. Output có [CHECK] thì bạn biết chỗ nào cần đọc kỹ. Danh sách giả định thì bạn biết điều kiện output còn đúng — và khi nào thì không.
Tốc độ của agent chỉ là giá niêm yết. Tốc độ thực lĩnh là sau khi trừ thời gian sửa lại những thứ không được verify đúng lúc. Khoảng cách giữa hai con số đó — bạn hoàn toàn có thể kiểm soát, và nó bắt đầu từ câu hỏi bạn thêm vào trước khi nhận kết quả.