Tôi đã dành hơn 500 giờ chú thích đầu ra của LLM, đánh giá chất lượng dịch thuật AI, và thực hiện RLHF (Học Tăng Cường từ Phản Hồi Con Người) cho các phòng thí nghiệm AI lớn. Đây không phải bài luận — tôi đã ngồi với đầu ra thực tế, bấm nút "cái nào tốt hơn" thực sự, và viết các phê bình giúp những mô hình này cải thiện.
AI Dịch Thực Sự Xuất Sắc Ở Đâu
Nội dung phổ thông với khối lượng lớn. Nếu bạn cần dịch 100.000 từ mô tả sản phẩm thương mại điện tử, một LLM được prompt tốt với biên tập viên hậu kỳ nhanh và rẻ hơn một người làm một mình. Điều này có thật, và dịch giả bỏ qua điều này đang mắc sai lầm.
Thuật ngữ nhất quán trên tập dữ liệu lớn là thế mạnh thực sự khác. Với system prompt và thuật ngữ được nhúng đúng cách, các mô hình hiện đại duy trì tính nhất quán thuật ngữ tốt hơn dịch giả người mệt mỏi ở giờ thứ sáu trong ngày.
AI Lặng Lẽ Thất Bại Ở Đâu
Độ chính xác y tế và pháp lý. Tôi đã xem hàng trăm bản dịch y tế do AI tạo trong các phiên RLHF. Lỗi không ngoạn mục — chúng tinh tế. Một mô hình sẽ tự tin dịch "unremarkable" trong báo cáo X-quang như đánh giá thẩm mỹ thay vì thuật ngữ lâm sàng có nghĩa là "bình thường".
Mô hình sai theo cách nghe trôi chảy. Đó là loại sai nguy hiểm.
Sắc thái văn hóa và văn phong. Tiếng Việt có hệ thống kính ngữ phức tạp — lựa chọn đại từ thay đổi toàn bộ mối quan hệ được ngụ ý trong văn bản. AI mặc định văn phong trung lập và bỏ lỡ tín hiệu xã hội mà người đọc tiếng Việt bản ngữ nhận ra ngay lập tức.
RLHF Dạy Tôi Điều Gì
Công việc chú thích tiết lộ điều thú vị: mô hình cải thiện nhanh nhất khi phản hồi con người cụ thể và có ngữ cảnh. Phản hồi tốt nhất tôi đưa ra không phải "Lựa chọn A chính xác hơn" mà là: "Lựa chọn A dùng văn phong lâm sàng đúng cho đối tượng y tá ICU Việt Nam; Lựa chọn B phù hợp cho tờ thông tin bệnh nhân."
Sự cụ thể đó chính xác là điều phân biệt đầu vào của dịch giả chuyên nghiệp với người thông thạo hai ngôn ngữ.
Tôi Không Lo Lắng
Công việc tôi làm mà AI không thể thay thế: hiểu ngữ cảnh khách hàng, biết khi nào thuật ngữ cần xác minh, phát hiện lỗi y tế tinh tế, điều chỉnh văn phong cho đối tượng cụ thể, chịu trách nhiệm chuyên nghiệp về đầu ra. Những điều này không biến mất khi mô hình cải thiện — chúng trở nên quan trọng hơn khi khối lượng tăng.
Tương lai không phải AI chống lại con người. Đó là con người được AI hỗ trợ làm việc tốt hơn với khối lượng cao hơn cho khách hàng hiểu sự khác biệt.