Có một khoảnh khắc mà gần như ai làm với agent lâu đủ đều trải qua.
Bạn ngồi nhìn agent vừa hoàn thành một task phức tạp — refactor một module, viết xong một bản spec dài, tổng hợp dữ liệu từ mười nguồn. Kết quả trông tốt. Bạn đọc lướt, gật đầu, merge. Rồi bạn nghĩ một điều bạn sẽ không bao giờ nói to ra: "Thế này thì verify làm gì?"
Đó là khoảnh khắc bạn bước vào giai đoạn nguy hiểm nhất.
01Bốn cột mốc trên một con đường không thẳng
Học làm việc với agent không giống học một kỹ năng thông thường — nơi bạn tích lũy kiến thức theo đường thẳng lên và đỉnh là lúc bạn giỏi nhất. Với agent, có một cái bẫy nằm chính xác ở điểm bạn tưởng mình đã vượt qua.
Bốn giai đoạn, và không ai đi thẳng qua giai đoạn ba mà không vấp. Bài này dừng lâu ở giai đoạn ba — vì đó là chỗ cú ngã đau nhất.
02Giai đoạn 1 — Prompt Tourist: mắt sáng và hy vọng cao
Bạn lần đầu dùng agent. Câu prompt đầu tiên kiểu như: "Viết cho tôi một function xử lý danh sách user."
Agent trả về một function trông đàng hoàng. Bạn copy-paste vào codebase. Nó chạy được. Bạn thấy kỳ diệu.
Rồi bạn thử lại với một yêu cầu phức tạp hơn một chút. Agent trả về thứ gì đó… gần đúng nhưng không hoàn toàn. Bạn hỏi lại, nó sửa — nhưng theo hướng bạn không dự đoán. Bạn sửa lại prompt cho rõ hơn, nó cho kết quả khác. Sau năm lần qua lại, bạn tự làm luôn cho nhanh.
Giai đoạn này đặc trưng bởi việc dùng agent như một cái máy — gõ vào câu hỏi, nhận ra câu trả lời, rồi hy vọng. Bạn chưa có mô hình trong đầu về tại sao nó làm đúng hay làm sai. Nên bạn không thể dự đoán, chỉ có thể phản ứng.
Cái nguy hiểm duy nhất của giai đoạn này: bạn vẫn verify. Bởi vì bạn chưa tin.
03Giai đoạn 2 — Học cấu trúc: thấy pattern, bắt đầu thiết kế
Đến một lúc, bạn nhận ra mấy thứ:
- Câu prompt mơ hồ → agent đoán mò → bạn mất thêm thời gian sửa hơn tự làm
- Nếu bạn mô tả đầy đủ hơn ở đầu, kết quả tốt hơn nhiều
- Một số pattern lặp lại có thể chuẩn hóa — viết một lần vào CLAUDE.md, lần sau không cần giải thích lại
Bạn bắt đầu dùng cấu trúc lệnh. Bạn thêm forcing function: "Trước khi viết code, hỏi tôi nếu thiếu thông tin." Bạn học cách đặt gate — plan trước, checkpoint giữa chừng. Kết quả cải thiện rõ.
Giai đoạn này là lúc bạn học nghề thật sự. Bạn thấy agent không phải máy phép — là một cộng sự cần được hướng dẫn rõ. Bạn trở nên tốt hơn ở việc hướng dẫn. Và bạn vẫn verify, vì habit của giai đoạn 1 vẫn còn đó.
04Giai đoạn 3 — Bẫy tin tưởng: nguy hiểm nhất
Giai đoạn này xảy ra từ từ, không có khoảnh khắc rõ ràng.
Bạn đã dùng agent được vài tháng. Bạn biết cách prompt. Kết quả tốt nhiều lần liên tiếp. Bạn cảm thấy đã nắm được nhịp. Rồi bạn bắt đầu review nhanh hơn một chút. Rồi nhanh hơn nữa. Rồi có một lần bạn bận, bạn lướt qua và merge mà không đọc kỹ — và mọi thứ vẫn ổn.
Thế là khoảng cách giữa "giao việc" và "verify kết quả" dần co lại.
Cái bẫy tinh vi ở chỗ: trong phần lớn thời gian, agent thực sự làm tốt. Nên behavior của bạn được reinforced. Bạn merge nhanh → không sao → bạn merge nhanh hơn → không sao → bạn gần như không verify → và rồi sao thật.
Cái bẫy không có tiếng chuông báo. Nó diễn ra trong những quyết định nhỏ, mỗi lần mỗi thêm một chút, cho đến khi khoảng cách đã quá xa mà bạn không còn nhớ nó từng gần hơn.
Lý do giai đoạn này nguy hiểm hơn giai đoạn 1: ở giai đoạn 1, bạn biết mình chưa biết. Nên bạn cẩn thận. Ở giai đoạn 3, bạn nghĩ mình đã biết. Nên bạn thôi cẩn thận.
Và cái agent không thay đổi. Nó vẫn đúng tám lần, sai hai lần, y hệt như trước. Chỉ có bạn thay đổi — bạn bắt đầu thấy tám lần là bằng chứng của mười lần, và bỏ qua hai lần kia như nhiễu.
05Giai đoạn 4 — Calibrated: không phải bớt tin, mà là tin đúng chỗ
Người ra khỏi giai đoạn 3 không trở về giai đoạn 2. Họ đến một chỗ khác.
Ở giai đoạn 4, bạn không verify mọi thứ — vừa mất thời gian vừa không cần thiết. Nhưng bạn cũng không verify theo cảm tính. Bạn có một framework: task này có reversible không? Hậu quả nếu sai là gì? Kết quả này có ai khác sẽ dựa vào không?
Câu trả lời những câu đó quyết định bạn dành bao nhiêu chú ý vào output — không phải "cảm giác agent dạo này ổn lắm".
"Task này sai thì ai chịu? Bao giờ thấy? Sửa mất bao lâu?" Trả lời ba câu đó trước khi quyết định verify kỹ hay lướt qua.
Mỗi lần agent làm sai đáng kể, nhớ lại nó. Không phải để mất tin — mà để có neo thực tế khi cảm giác "nó ổn lắm" bắt đầu trỗi dậy quá mạnh.
Hai habit của giai đoạn 4. Không cần nhiều hơn — cần nhất quán.
06Bạn sẽ không tránh khỏi giai đoạn 3
Đây là điều thật: gần như không ai nhảy được từ giai đoạn 2 thẳng lên giai đoạn 4 mà không vấp ở 3. Vì để biết mình đang ở giai đoạn 3, bạn cần vấp đủ mạnh để nhận ra mình đã drift.
Điều khác nhau giữa người ra khỏi giai đoạn 3 nhanh và người mắc kẹt lâu không phải là họ thông minh hơn. Là họ có hai thứ: một cú ngã đủ đau để thay đổi hành vi, và một mô hình đủ rõ để nhận ra mình đang ở đâu.
Bài này là mô hình đó.
Giai đoạn 3 là nơi bạn dừng verify vì bạn nghĩ bạn đã biết. Giai đoạn 4 là nơi bạn verify đúng chỗ vì bạn thực sự biết — biết agent không thay đổi, chỉ có bạn thay đổi. Và biết rằng chính sự thay đổi của bạn mới là thứ cần được quản.