Skill · Prompt

Thử một việc nhỏ trước khi tin agent ở miền mới

Một prompt buộc agent làm một mảnh nhỏ và lộ cách nó nghĩ — trước khi bạn giao nguyên việc lớn ở lĩnh vực nó chưa từng chứng minh.

DạngPrompt

Ngôn ngữRead in English →

Agent của bạn giỏi việc quen — bạn đã thấy nó làm trăm lần. Rồi bạn giao một việc ở miền hoàn toàn mới và mặc định nó cũng giỏi y vậy. Cùng một con agent, nhưng giỏi review code không có nghĩa là giỏi phân tích pháp lý hay đọc số liệu ngành lạ. Bạn chỉ phát hiện khi nó đã làm xong nguyên việc lớn — và sai theo kiểu bạn không ngờ.

Người làm lâu không tin thẳng vào miền mới. Họ thử một mảnh nhỏ trước, quan sát cách agent tiếp cận, rồi mới chỉnh mức tin. Không phải vì nghi ngờ — vì cùng một model behave khác nhau tùy domain, và một mảnh nhỏ cho bạn biết khác chỗ nào trước khi nó kịp đắt.

✕ Giao thẳng việc lớn

Quen ở miền cũ → mặc định giỏi ở miền mới

▼

Nó chạy hết, sai theo kiểu đặc thù miền mới

▼

Biết quá trễ, ở đúng việc quan trọng

✓ Thử mảnh nhỏ trước

Một mảnh đại diện + lộ cách nghĩ, chỗ không chắc

▼

Bạn soi cách tiếp cận vs cái domain cần

▼

Chỉnh mức tin rồi mới scale lên việc thật

Dán nó ở lần đầu giao một loại việc mới, không phải mỗi lần. Mấu chốt là bắt nó lộ cách nghĩ chứ không chỉ đưa kết quả — vì cái bạn đang đo không phải "kết quả đúng không", mà "cách nó tiếp cận có khớp cái miền này thật sự cần không". Một mảnh nhỏ làm đúng cách đáng tin hơn một mảnh lớn ra kết quả đúng nhờ may.

Dán thẳng vào chat

This is a new kind of task for you, so let's calibrate before I hand over the real thing:

1. I'll give you a small, representative slice first — do just that, not the whole task.
2. Show your work: not only the result, but how you reached it and where you were unsure.
3. Then stop and wait. I'll check whether your approach matches what this domain actually needs.

Don't scale up to the full task until I've seen the small one and said go. A good result on a tiny slice — reached the right way — tells me how much to trust you on the big one.

Muốn agent tự cài hộ?

Thêm rule này vào CLAUDE.md của tôi, nguyên văn:

This is a new kind of task for you, so let's calibrate before I hand over the real thing:

1. I'll give you a small, representative slice first — do just that, not the whole task.
2. Show your work: not only the result, but how you reached it and where you were unsure.
3. Then stop and wait. I'll check whether your approach matches what this domain actually needs.

Don't scale up to the full task until I've seen the small one and said go. A good result on a tiny slice — reached the right way — tells me how much to trust you on the big one.