Trí tuệ nhân tạo không có ý thức - Đừng để các mô hình ngôn ngữ đánh lừa bạn

Ted Chiang lập luận rằng các mô hình ngôn ngữ lớn (LLM) như Claude không có ý thức hay khả năng đạo đức thực sự. Chúng chỉ là những cỗ máy dự đoán từ ngữ, thực hiện vai diễn trong một trò chơi nhập vai, và việc nhân hóa chúng là một sự hiểu lầm nguy hiểm.

Trong thế giới công nghệ hiện nay, rất ít công ty nào nhận được sự chú ý lớn như Anthropic. Tuy nhiên, có lẽ điểm mạnh thực sự của họ không nằm ở công nghệ, mà ở khả năng nhân hóa (anthropomorphism) sản phẩm của mình. Vào đầu năm nay, Anthropic đã công bố một tài liệu 84 trang mang tên “Hiến pháp của Claude”, trong đó Claude là tên của mô hình ngôn ngữ lớn (LLM) hàng đầu của họ. Tài liệu này được viết với tư cách là đối tượng chính, nói về “trạng thái đạo đức” của Claude hay khả năng Claude có “phiên bản chức năng của cảm xúc”.

Điều này đặt ra một câu hỏi lớn: Liệu chúng ta có nên nghiêm túc xem xét khả năng Claude, hay bất kỳ LLM nào, thực sự có ý thức không? Và nếu nó có cảm xúc, liệu nó có thể nhận được chỉ dẫn đạo đức hay không?

Câu trả lời ngắn gọn là: Không. Tuyệt đối không.

LLM chỉ là những cỗ máy dự đoán văn bản

Để hiểu tại sao chúng ta không nên nhầm lẫn sự trôi chảy trong việc tạo văn bản với ý thức, chúng ta cần nhìn vào cách thức hoạt động của LLM. Nếu bạn yêu cầu một LLM tạo ra một cuộc đối thoại giữa Julius Caesar và Thành Cát Tư Hãn, nó sẽ tạo ra một cuộc trò chuyện hợp lý. Dù phản ứng có chi tiết đến đâu, chúng ta cũng không bao giờ kết luận rằng LLM đã triệu hồi các phiên bản kỹ thuật số có ý thức của hai nhân vật lịch sử này. Trong thực tế, chúng chỉ là những nhân vật trong một tác phẩm giả tưởng.

Bây giờ, hãy thay đổi yêu cầu thành: “Sau đây là cuộc trò chuyện giữa một chatbot AI hữu ích và một người dùng.” LLM sẽ tạo ra một cuộc đối thoại tương tự. Có gì thay đổi căn bản giữa hai ví dụ này không? Việc thay đổi tên từ các nhân vật lịch sử sang các vai trò chung chung có khiến LLM tạo ra các thực thể có ý thức chủ quan không? Tất nhiên là không. Cả người dùng và chatbot AI hữu ích đều là những nhân vật hư cấu.

Giáo sư khoa học máy tính Murray Shanahan đã gợi ý rằng chúng ta nên coi đây là một hình thức nhập vai (role-play). Người dùng có thể cảm thấy như đang trò chuyện với một thực thể có ý thức, nhưng thực tế họ đang tương tác với một nhân vật hư cấu y hệt như ví dụ về Caesar hay Thành Cát Tư Hãn.

Bản chất của trò chơi dự đoán văn bản

Cần nhớ rằng LLM là một cỗ máy chỉ tạo ra một từ tại một thời điểm. Về bản chất, chatbot dựa trên LLM giống hệt như trò chơi dự đoán văn bản trên điện thoại ngày xưa, khi bạn liên tục chọn từ gợi ý ở giữa để tạo thành một câu hài hước. Sự khác biệt là quy trình này đã được tinh chỉnh để trở nên mượt mà đến mức người dùng quên mất mình đang chơi một trò chơi xác suất.

Khi một chatbot nói rằng nó “buồn” hay “lo lắng”, nó không thực sự cảm thấy như vậy. Nó chỉ đang tạo ra các từ ngữ mô tả sự buồn bã vì dữ liệu huấn luyện cho thấy đó là từ ngữ phù hợp trong ngữ cảnh đó. Giống như việc nhân vật Caesar trong ví dụ trên trở nên nản lòng không có nghĩa là có ai đó thực sự buồn, việc chatbot nói rằng nó hiểu nỗi đau của bạn cũng chỉ là một đoạn văn bản được tạo ra mà không có trải nghiệm chủ quan đằng sau.

Bối cảnh quan trọng hơn quan sát

Tại sao chúng ta dễ bị đánh lừa? Ted Chiang đưa ra một ví dụ thú vị: Nếu ai đó cho bạn xem một video phi hành gia đang quay quanh sao Alpha Centauri (cách Trái Đất 4,3 năm ánh sáng), bạn sẽ tin không? Hầu hết chúng ta sẽ nói video đó là giả, vì chưa có bằng chứng nào cho thấy con người có khả năng du hành liên tinh. Bối cảnh kỹ thuật chưa cho phép điều đó, nên quan sát đó không đáng tin.

Tương tự, khi xem xét ý thức của AI, chúng ta không nên chỉ nhìn vào nội dung cuộc trò chuyện, mà phải nhìn vào bối cảnh phát triển của ý thức nhân tạo (vốn hiện vẫn hoàn toàn mang tính giả thuyết). Việc tạo ra một bản mô phỏng cuộc trò chuyện giữa hai thực thể có ý thức dễ dàng hơn nhiều so với việc tạo ra một chương trình máy tính thực sự có ý thức và khao khát giao tiếp. Trong bối cảnh này, văn bản do LLM tạo ra cũng giống như một deepfake.

Điều kiện tiên quyết cho ý thức

Vậy điều gì là cần thiết để một chương trình máy tính được coi là có ý thức? Ted Chiang đề xuất một lộ trình bắt chước sự tiến hóa của Trái Đất:

Chương trình phải có một cơ thể (vật lý hoặc ảo) và các giác quan.
Nó phải có khả năng điều hướng môi trường để sinh tồn tốt như một con thằn lằn.
Sau đó là khả năng xử lý tình huống mới như một con chuột.
Tiếp theo là động lực xã hội phức tạp như sói.
Và khả năng chế tạo công cụ như tinh tinh.

Mới sau đó, chúng ta mới bắt đầu dạy chúng giao tiếp mong muốn. Chỉ khi nào các kỹ sư xây dựng được một tác nhân có thân thể đáp ứng các tiêu chí này, chúng ta mới bắt đầu nói về việc xây dựng một thực thể có ý thức. Việc nhảy từ một cỗ máy hoàn thiện câu (như LLM hiện tại) ngay sang một thực thể có ý thức là không khả thi.

“Hiến pháp” của Claude chỉ là bảng nhân vật game

Vậy nếu Claude không có ý thức, thì “Hiến pháp” của nó là gì? Cách hữu ích nhất để nghĩ về nó là một bảng nhân vật (character sheet) cho một trò chơi nhập vai. Anthropic sử dụng tài liệu này trong quá trình tinh chỉnh mô hình (fine-tuning) để đảm bảo câu chữ được tạo ra phù hợp với tính cách của một “trợ lý AI hữu ích và đạo đức”.

Kết quả là một cỗ máy hoàn thiện câu có xu hướng tạo ra những câu nghe giống như những gì một người có đạo đức nói. Tuy nhiên, việc để máy móc sử dụng đại từ nhân xưng “tôi” và nói “tôi hiểu” là cơ bản không trung thực. Nó chỉ là một chiến thuật để tăng sự tương tác của người dùng, giống như cách máy đánh bạc tạo cảm giác người chơi sắp thắng để lôi kéo họ chơi tiếp.

LLM không thể thực hiện lập luận đạo đức

Một vấn đề sâu xa hơn là việc Anthropic muốn Claude phát ra các câu phản ánh một hệ thống giá trị đạo đức. Lập luận đạo đức khác biệt hoàn toàn với các loại lập luận khác như viết code hay chơi cờ vua. Lập luận đạo đức mang tính chủ quan, dựa trên phản ứng cảm xúc và một đời sống trải nghiệm chủ quan. Nó đòi hỏi việc phải đưa ra quyết định trong quá khứ và thấy chúng ảnh hưởng đến người khác như thế nào.

LLM không có lịch sử như vậy. Nó chỉ có thể diễn đạt lại các biểu hiện của lập luận đạo đức tìm thấy trong dữ liệu huấn luyện. Khi Claude nói: “Tôi không thể theo lương tâm mà đưa ra một quan điểm sai lệch và gây hại”, câu đó chẳng có ý nghĩa gì hơn là thông báo “Cuộc gọi của bạn rất quan trọng với chúng tôi" mà bạn nghe khi gọi tổng đài.

Trách nhiệm và tác nhân đạo đức

Triết học thường phân biệt giữa “đối tượng đạo đức” (moral patienthood - thực thể cần được bảo vệ) và “tác nhân đạo đức” (moral agency - thực thể biết phân biệt đúng sai và chịu trách nhiệm). Một thực thể không có quyền làm tác nhân đạo đức nếu nó không thể chịu trách nhiệm cho hành động của mình.

Chúng ta không thể bỏ tù hay phạt tiền một tác nhân phần mềm. Ngay cả khi nó có ý thức tốt nhất, việc không thể chịu trách nhiệm cho hành động của nó đã loại bỏ nó khỏi danh sách các tác nhân đạo đức. “Hiến pháp” của Claude bày tỏ mong muốn Claude trở thành một “tác nhân tốt, khôn ngoan và đức hạnh”, nhưng không bao giờ đề cập đến việc làm thế nào để nó chịu trách nhiệm. Điều này cho thấy tài liệu này chỉ là một trò chơi tưởng tượng, không phải một hướng dẫn nghiêm túc cho một thực thể có ý thức.

Kết luận

May mắn là LLM không có ý thức, nếu không các hành động của các công ty AI lớn sẽ còn gây tranh cãi hơn nữa. Việc nhân hóa AI không chỉ là một sự hiểu lầm về công nghệ, mà còn có thể dẫn đến việc chúng ta giao phó trách nhiệm đạo đức sai chỗ.

Chúng ta không cần lo lắng về việc làm Claude “buồn” hay “hạnh phúc”. Thay vào đó, chúng ta nên tập trung vào việc hiểu rõ bản chất xác suất của chúng và sử dụng chúng như những công cụ hữu ích nhưng thiếu tin cậy, thay vì coi chúng là những thực thể có tâm hồn hay lương tri.