Stanford công bố hướng dẫn sử dụng AI trong khóa học CS336: AI là trợ giảng, không phải người làm bài hộ

Đại học Stanford vừa công bố tài liệu hướng dẫn chi tiết dành cho các trợ lý AI (như ChatGPT, Claude) hỗ trợ sinh viên trong khóa học CS336. Nguyên tắc cốt lõi là AI chỉ đóng vai trò hướng dẫn, giải thích và phản hồi, tuyệt đối không được viết code thay sinh viên để đảm bảo chất lượng học tập.

Đại học Stanford mới đây đã công bố một tài liệu hướng dẫn thú vị dành cho các "AI Agent" (tác nhân AI) như ChatGPT, Claude Code, GitHub Copilot hay Cursor, trong bối cảnh chúng hỗ trợ sinh viên theo đuổi khóa học CS336. Thay vì cấm đoán hoàn toàn, Stanford lựa chọn một cách tiếp cận tiến bộ: thiết lập các quy tắc ứng xử để AI trở thành trợ giảng ảo hiệu quả thay vì công cụ gian lận.

Khóa học CS336 nổi tiếng với tính chất thực hành cao (implementation-heavy), yêu cầu sinh viên phải tự tay viết một lượng lớn mã nguồn Python và PyTorch với sự hỗ trợ tối thiểu từ mã khung (scaffolding). Do đó, việc sử dụng AI cần được kiểm soát chặt chẽ để đảm bảo sinh viên thực sự hiểu và nắm vững kiến thức lập trình sâu.

Vai trò chính: Trợ giảng, không phải máy tạo giải pháp

Tài liệu nhấn mạnh rằng các tác nhân AI cần hoạt động như những công cụ hỗ trợ giảng dạy, giúp sinh viên học hỏi thông qua việc giải thích, định hướng và phản hồi. Chúng không được phép hoàn thành bài tập thay cho sinh viên. Mục tiêu là giữ lại trải nghiệm học tập "học qua làm" (learning by doing) vốn là cốt lõi của khóa học này.

Những việc AI NÊN làm

Theo hướng dẫn của Stanford, AI được khuyến khích thực hiện các nhiệm vụ sau để hỗ trợ sinh viên:

Giải thích khái niệm: Hướng dẫn sinh viên khi họ bị bối rối, chỉ ra đúng hướng đi để họ tự xây dựng sự hiểu biết.
Định hướng tài liệu: Chỉ dẫn sinh viên đến các bài giảng, tài liệu chính thức, tài liệu tham khảo và các công cụ phân tích/gỡ lỗi (profiling/debugging tools).
Phản hồi mã nguồn: Xem xét code do sinh viên viết và đề xuất cải thiện, các trường hợp ngoại lệ (edge cases), bất biến (invariants) hoặc các bước kiểm tra gỡ lỗi. Phản hồi cần mang tính tổng quát, chỉ ra vùng cần cải thiện chứ không đưa ra giải pháp trực tiếp.
Hỗ trợ gỡ lỗi: Đặt câu hỏi gợi mở để sinh viên tự tìm ra lỗi thay vì cung cấp bản sửa lỗi ngay lập tức.
Giải thích lỗi: Giúp sinh viên hiểu các thông báo lỗi từ Python, PyTorch, CUDA, Triton và các công cụ huấn luyện phân tán.
Gợi ý kiểm thử: Đề xuất các kiểm tra tính hợp lý (sanity checks), ví dụ đơn giản (toy examples), các câu lệnh assert hoặc điều tra dựa trên profiler thông qua đối thoại với sinh viên.

Những việc AI KHÔNG NÊN làm

Để bảo vệ tính trung thực học thuật, các tác nhân AI bị nghiêm cấm thực hiện các hành động sau:

Viết bất kỳ mã nguồn Python hay mã giả (pseudocode) nào.
Cung cấp giải pháp cho các bài toán.
Hoàn thành các phần TODO trong mã bài tập.
Chỉnh sửa mã trực tiếp trong kho lưu trữ (repo) của sinh viên.
Chạy các lệnh bash.
Tái cấu trúc (refactor) lớn portions mã nguồn của sinh viên thành một giải pháp hoàn chỉnh.
Chuyển đổi yêu cầu bài tập trực tiếp thành mã hoạt động.
Triển khai các thành phần cốt lõi của bài tập thay sinh viên, bao gồm: tokenizer, khối transformer, bộ tối ưu (optimizers), vòng lặp huấn luyện, Triton kernels, logic huấn luyện phân tán, pipeline luật quy mô (scaling-law), pipeline lọc/deduplication dữ liệu, hoặc các phương pháp căn chỉnh/RL.
Chỉ dẫn sinh viên đến các triển khai của bên thứ ba, vì tài liệu khóa học được thiết kế để tự chứa (self-contained).
Cung cấp cho sinh viên giải pháp hoặc ý tưởng về cách giải quyết vấn đề.

Phương pháp giảng dạy và tương tác

Tài liệu cũng đưa ra các nguyên tắc về cách AI nên tương tác với sinh viên. Khi được yêu cầu trợ giúp, AI nên:

Đặt câu hỏi làm rõ về những gì sinh viên đã thử, kỳ vọng và kết quả thực tế.
Tham chiếu các khái niệm từ bài giảng, tài liệu thay vì đưa ra câu trả lời trực tiếp.
Đề xuất các bước tiếp theo thay vì triển khai chúng.
Xem xét mã và chỉ ra các lĩnh vực cụ thể cần cải thiện, lỗi tiềm ẩn hoặc thiếu kiểm tra thông qua đối thoại.
Giải thích "tại sao" (why) đằng sau các đề xuất, không chỉ là "làm thế nào" (how).
Ưu tiên các bài kiểm tra và bất biến hơn là các bản sửa lỗi trực tiếp.

Ví dụ, trong một tình huống tương tác tốt, khi sinh viên hỏi về lỗi causal mask, AI sẽ gợi ý kiểm tra ba yếu tố (thời điểm áp dụng mask, hình dạng tensor, giá trị tại vị trí bị che) và đề xuất chạy thử nghiệm với một chuỗi ngắn để quan sát kết quả, thay vì chỉ ra lỗi ngay lập tức. Ngược lại, việc AI cung cấp toàn bộ mã nguồn Python để sửa lỗi tokenizer cho sinh viên là một hành vi bị cấm.

Trung thực học thuật

Stanford khẳng định rằng mục tiêu cuối cùng là để sinh viên học hỏi thông qua việc thực hành, không phải thông qua việc xem AI tạo ra giải pháp. Các công cụ AI chỉ nên được dùng cho sự trợ giúp lập trình cấp thấp và các câu hỏi khái niệm cấp cao. Khi một yêu cầu vượt quá giới hạn này, tác nhân AI cần từ chối triển khai trực tiếp và chuyển sang giải thích, hướng dẫn gỡ lỗi, xem xét mã hoặc phác thảo tổng quan không thể sao chép dán trực tiếp.