SHRDLU: Cột mốc lịch sử của AI trong việc hiểu ngôn ngữ tự nhiên

29 tháng 4, 2026·4 phút đọc

SHRDLU là chương trình máy tính tiên phong được phát triển tại MIT vào cuối thập niên 1960, nổi tiếng với khả năng hiểu và xử lý ngôn ngữ tự nhiên. Hệ thống này cho phép người dùng giao tiếp bằng tiếng Anh để thao tác các vật thể trong một môi trường "thế giới các khối" ảo, đặt nền móng cho các nghiên cứu sau này về xử lý ngôn ngữ và trí tuệ nhân tạo.

SHRDLU: Cột mốc lịch sử của AI trong việc hiểu ngôn ngữ tự nhiên

SHRDLU là một chương trình máy tính sơ khai về việc hiểu ngôn ngữ tự nhiên (natural-language understanding), được Terry Winograd phát triển tại Học viện Công nghệ Massachusetts (MIT) trong giai đoạn 1968–1970. Trong chương trình này, người dùng có thể thực hiện các cuộc hội thoại với máy tính, di chuyển các vật thể, đặt tên cho các tập hợp và truy vấn trạng thái của một môi trường được đơn giản hóa gọi là "thế giới các khối" (blocks world) — về cơ bản là một chiếc hộp ảo chứa các khối hình học khác nhau.

Chương trình được viết bằng các ngôn ngữ lập trình Micro Planner và Lisp trên máy tính DEC PDP-6 và một thiết bị đầu cuối đồ họa của DEC. Sau này, các bổ sung đã được thực hiện tại các phòng thí nghiệm đồ họa máy tính của Đại học Utah, thêm vào khả năng kết xuất 3D hoàn chỉnh cho "thế giới" của SHRDLU.

Tên gọi SHRDLU bắt nguồn từ ETAOIN SHRDLU, sự sắp xếp các phím chữ cái trên máy in Linotype theo thứ tự giảm dần của tần suất sử dụng trong tiếng Anh.

Cách thức hoạt động

SHRDLU chủ yếu là một trình phân tích ngôn ngữ (parser) cho phép người dùng tương tác bằng các thuật ngữ tiếng Anh. Người dùng đưa ra lệnh cho SHRDLU di chuyển các vật thể khác nhau trong "thế giới các khối" chứa các vật thể cơ bản như khối, hình nón và quả bóng. SHRDLU đã kết hợp bốn ý tưởng đơn giản để tạo nên sự mô phỏng "hiểu" thuyết phục hơn.

Đầu tiên, thế giới của SHRDLU đủ đơn giản để toàn bộ tập hợp các vật thể và vị trí có thể được mô tả bằng chỉ khoảng 50 từ: danh từ như "khối" (block) và "hình nón" (cone), động từ như "đặt lên" (place on) và "di chuyển đến" (move to), và tính từ như "lớn" (big) và "xanh" (blue). Các kết hợp có thể có của các khối ngôn ngữ cơ bản này khá đơn giản.

SHRDLU cũng bao gồm một bộ nhớ cơ bản để cung cấp ngữ cảnh. Người dùng có thể yêu cầu SHRDLU "đặt hình nón xanh lên khối đỏ" và sau đó "lấy hình nón đi"; "hình nón" sẽ được hiểu là hình nón xanh vừa được nhắc đến. SHRDLU có thể tìm kiếm ngược lại qua các tương tác để tìm ngữ cảnh phù hợp trong hầu hết các trường hợp khi các tính từ bổ sung được cung cấp. Người dùng cũng có thể đặt câu hỏi về lịch sử; ví dụ, "bạn có nhặt lên bất cứ thứ gì trước hình nón không?".

Một tác dụng phụ của bộ nhớ này và các quy tắc gốc mà SHRDLU được cung cấp là chương trình có thể trả lời các câu hỏi về những gì có thể thực hiện được trong thế giới và những gì không. Ví dụ, SHRDLU có thể suy luận rằng các khối có thể được xếp chồng lên nhau bằng cách tìm kiếm ví dụ, nhưng cũng nhận ra rằng các hình tam giác không thể xếp chồng lên nhau sau khi đã thử. "Thế giới" này chứa các quy tắc vật lý cơ bản để làm cho các khối bị đổ xuống, độc lập với trình phân tích ngôn ngữ.

Cuối cùng, SHRDLU cũng có thể ghi nhớ các tên được đặt cho vật thể hoặc sự sắp xếp của chúng. Ví dụ, người dùng có thể nói "một tháp chuông là một hình tam giác nhỏ nằm trên một hình chữ nhật cao"; SHRDLU sau đó có thể trả lời các câu hỏi về các tháp chuông trong thế giới các khối và xây dựng các tháp mới.

Tầm quan trọng và Di sản

SHRDLU được coi là một bản demo cực kỳ thành công của trí tuệ nhân tạo (AI). Điều này đã dẫn đến sự lạc quan thái quá của các nhà nghiên cứu AI khác, nhưng sự lạc quan đó sớm biến mất khi các hệ thống sau này cố gắng xử lý các tình huống có mức độ mơ hồ và phức tạp thực tế hơn. Các nỗ lực tiếp theo theo kiểu SHRDLU, như Cyc, có xu hướng tập trung vào việc cung cấp cho chương trình nhiều thông tin hơn để từ đó rút ra kết luận.

Trong một cuộc phỏng vấn năm 1991, Winograd đã nhận xét về SHRDLU rằng áp lực lúc đó là "demo hoặc chết" (demo or die). Ông cho rằng AI đã chịu nhiều từ điều này, vì nó dẫn đến những "làng Potemkin" — những thứ trông có vẻ tốt trong bản demo, nhưng khi nhìn sâu hơn thì không có đủ cấu trúc để thực sự hoạt động nói chung.

Mặc dù không được phát triển có chủ đích như vậy, SHRDLU được coi là ví dụ chính thức đầu tiên được biết đến về hư cấu tương tác (interactive fiction), vì người dùng tương tác bằng các lệnh đơn giản để di chuyển vật thể xung quanh một môi trường ảo, mặc dù thiếu yếu tố kể chuyện đặc trưng thường thấy trong thể loại hư cấu tương tác.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗