Ba Định Luật Ngược của AI: Nguyên tắc an toàn cho con người trong kỷ nguyên trí tuệ nhân tạo

Bài viết đề xuất ba định luật ngược dành cho con người khi tương tác với AI: không nhân hóa hệ thống, không tin tưởng mù quáng vào đầu ra và không từ chối trách nhiệm đối với hậu quả sử dụng.

Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, các dịch vụ chatbot trí tuệ nhân tạo (AI) tạo sinh ngày càng trở nên tinh vi và phổ biến hơn. Các hệ thống này hiện nay đã được tích hợp sâu vào các công cụ tìm kiếm, công cụ phát triển phần mềm cũng như các ứng dụng văn phòng. Đối với nhiều người, chúng đã nhanh chóng trở thành một phần không thể thiếu trong công việc hàng ngày.

Các dịch vụ này chứng tỏ tính hữu ích cao, đặc biệt là trong việc khám phá các chủ đề mới lạ và hỗ trợ nâng cao năng suất. Tuy nhiên, cách thức quảng bá và sử dụng các dịch vụ này cũng có thể tiềm ẩn những mối nguy hiểm, đặc biệt nếu chúng ta hình thành thói quen tin tưởng vào kết quả đầu ra mà không thực hiện sự kiểm tra cần thiết.

Cạm bẫy trong thiết kế AI

Một số lựa chọn thiết kế trong các hệ thống AI hiện đại có thể khuyến khích người dùng chấp nhận kết quả một cách thiếu phê phán. Ví dụ, nhiều công cụ tìm kiếm phổ biến hiện nay đang làm nổi bật các câu trả lời được tạo bởi AI ngay trên cùng trang kết quả. Khi điều này xảy ra, người dùng rất dễ dừng cuộn trang, chấp nhận câu trả lời được tạo ra và chuyển sang việc khác.

Theo thời gian, điều này có thể vô tình huấn luyện người dùng coi AI là thẩm quyền mặc định thay vì chỉ là điểm khởi đầu để điều tra thêm. Tác giả mong muốn mỗi dịch vụ AI tạo sinh đều đi kèm một cảnh báo ngắn gọn nhưng rõ ràng, giải thích rằng các hệ thống này đôi khi có thể tạo ra kết quả sai về mặt thực tế, gây hiểu lầm hoặc không đầy đủ. Những cảnh báo này cần nhấn mạnh rằng việc tin tưởng vào đầu ra của AI một cách thói quen có thể gây nguy hiểm. Trong thực tế, ngay cả khi những cảnh báo này tồn tại, chúng thường rất tối giản và bị làm mờ về mặt thị giác.

Định luật Ngược của Robot học

Trong thế giới khoa học viễn tưởng, chúng ta có Ba Định luật Robot học do Isaac Asimov đề xuất, nhằm hạn chế hành vi của robot để bảo vệ con người. Tuy nhiên, xét đến mức độ phổ biến của AI hiện nay, chúng ta cần những quy tắc tương tự nhưng áp dụng cho con người để tự bảo vệ mình. Tác giả gọi chúng là Định luật Ngược của Robot học. Các định luật này áp dụng cho bất kỳ tình huống nào con người cần tương tác với một "robot" — thuật ngữ ở đây được hiểu là bất kỳ máy móc, chương trình máy tính, dịch vụ phần mềm hoặc hệ thống AI nào có khả năng thực hiện các nhiệm vụ phức tạp một cách tự động.

Dưới đây là ba định luật ngược của robot học:

Con người không được nhân hóa các hệ thống AI.
Con người không được tin tưởng mù quáng vào đầu ra của các hệ thống AI.
Con người phải chịu trách nhiệm đầy đủ và giải trình về các hậu quả phát sinh từ việc sử dụng các hệ thống AI.

Không Nhân hóa (Non-Anthropomorphism)

Con người không được nhân hóa các hệ thống AI. Nghĩa là, con người không được gán cho chúng cảm xúc, ý định hay tư cách đạo đức. Việc nhân hóa làm méo mó phán đoán. Trong các trường hợp cực đoan, việc nhân hóa có thể dẫn đến sự phụ thuộc về mặt cảm xúc.

Các hệ thống chatbot hiện đại thường có giọng điệu trò chuyện và đồng cảm. Chúng sử dụng các cụm từ lịch sự và các tín hiệu xã hội giống hệt tương tác giữa người với người. Mặc dù điều này giúp việc sử dụng dễ dàng và thú vị hơn, nó cũng khiến chúng ta dễ quên đi bản chất thực sự của chúng: các mô hình thống kê lớn tạo ra văn bản hợp lý dựa trên các mẫu trong dữ liệu.

Các nhà cung cấp dịch vụ chatbot AI có thể làm tốt hơn ở khía cạnh này. Trong nhiều trường hợp, các hệ thống được điều chỉnh có chủ đích để cảm thấy "con người" hơn thay vì máy móc hơn. Một cách tiếp cận hơi "robot" hơn sẽ lành mạnh hơn về lâu dài. Giọng điệu máy móc sẽ giảm khả năng người dùng nhầm lẫn sự trôi chảy của ngôn ngữ thành sự hiểu biết, phán đoán hoặc ý định.

Dù các nhà cung cấp có thay đổi hay không, trách nhiệm tránh cạm bẫy này vẫn nằm ở người dùng. Chúng ta phải chủ động tránh thói quen coi các hệ thống AI là tác nhân xã hội hoặc tác nhân đạo đức. Việc này giúp duy trì tư duy rõ ràng về khả năng và hạn chế của chúng.

Không Phụ Thuộc Mù Quáng (Non-Deference)

Con người không được tin tưởng mù quáng vào đầu ra của các hệ thống AI. Nội dung do AI tạo ra không được coi là thẩm quyền nếu không có sự xác minh độc lập phù hợp với ngữ cảnh.

Nguyên tắc này không độc quyền đối với AI. Trong hầu hết các lĩnh vực cuộc sống, chúng ta không nên chấp nhận thông tin một cách thiếu phê phán. Tuy nhiên, hướng dẫn từ các tổ chức uy tín thường đã được xem xét bởi các chuyên gia trong lĩnh vực đó (peer review). Ngược lại, khi chúng ta nhận được câu trả lời từ một chatbot AI trong một phiên chat riêng tư, không có sự xem xét nào đối với câu trả lời ngẫu nhiên cụ thể đó được trình bày trước chúng ta. Do đó, trách nhiệm kiểm tra phản hồi một cách phê phán thuộc về chúng ta.

Mặc dù các hệ thống AI ngày nay đã khá ấn tượng ở một số nhiệm vụ, chúng vẫn được biết đến là tạo ra đầu ra sai sót. Ngay cả khi các hệ thống AI cải thiện đến mức tạo ra đầu ra đáng tin cậy với xác suất cao, do bản chất ngẫu nhiên vốn có, vẫn sẽ có một xác suất nhỏ tạo ra đầu ra chứa lỗi. Điều này làm cho chúng đặc biệt nguy hiểm khi được sử dụng trong các bối cảnh mà lỗi rất tinh vi nhưng tốn kém. Hậu quả tiềm năng càng nghiêm trọng, gánh nặng xác minh càng phải cao.

Trong một số ứng dụng như xây dựng chứng minh toán học hoặc phát triển phần mềm, chúng ta có thể thêm một lớp xác minh tự động dưới dạng trình kiểm tra chứng minh hoặc kiểm thử đơn vị (unit tests) để xác minh đầu ra của AI. Trong các trường hợp khác, chúng ta phải tự xác minh đầu ra.

Không Từ Chối Trách Nhiệm (Non-Abdication of Responsibility)

Con người phải chịu trách nhiệm đầy đủ về các quyết định liên quan đến AI và giải trình về hậu quả phát sinh từ việc sử dụng nó. Nếu một kết quả tiêu cực xảy ra do tuân theo lời khuyên hoặc quyết định do AI tạo ra, không đủ để nói rằng "AI đã bảo chúng ta làm như vậy". Các hệ thống AI không chọn mục tiêu, không tự triển khai bản thân và không chịu chi phí thất bại. Con người và tổ chức mới là người làm điều đó. Hệ thống AI là một công cụ và giống như bất kỳ công cụ nào khác, trách nhiệm sử dụng nó thuộc về những người quyết định dựa vào nó.

Tuy nhiên, nói thì dễ hơn làm. Điều này trở nên đặc biệt phức tạp trong các ứng dụng thời gian thực như xe tự lái, nơi con người không có cơ hội xem xét đầy đủ các quyết định được đưa ra bởi hệ thống AI trước khi nó hành động. Yêu cầu người lái xe luôn cảnh giác không giải quyết được vấn đề rằng hệ thống AI thường hành động trong thời gian ngắn hơn thời gian con người có thể can thiệp.

Mặc dù có hạn chế nghiêm trọng này, chúng ta phải thừa nhận rằng nếu hệ thống AI thất bại trong các ứng dụng như vậy, trách nhiệm điều tra sự thất bại và thêm các rào chắn an toàn bổ sung vẫn phải thuộc về con người chịu trách nhiệm thiết kế hệ thống.

Trong tất cả các trường hợp khác, nơi không có ràng buộc vật lý ngăn cản con người xem xét đầu ra của AI trước khi hành động, bất kỳ hậu quả tiêu cực nào phát sinh từ việc sử dụng AI phải hoàn toàn thuộc về người ra quyết định là con người. Là một nguyên tắc chung, chúng ta không bao giờ nên chấp nhận "AI đã nói vậy" như một cái cớ chấp nhận được cho các kết quả có hại. Có, AI có thể đã đưa ra đề xuất, nhưng một con người đã quyết định làm theo nó, vì vậy con người đó phải chịu trách nhiệm. Điều này hoàn toàn quan trọng để ngăn chặn việc sử dụng AI bừa bãi trong các tình huống mà việc sử dụng vô trách nhiệm có thể gây hại đáng kể.

Kết luận

Ba định luật được nêu trên dựa trên các mô hình sử dụng mà tác giả quan sát được và cảm thấy có hại cho xã hội. Tác giả hy vọng rằng với ba định luật đơn giản này, chúng ta có thể khuyến khích đồng loại mình dừng lại và suy ngẫm về cách họ tương tác với các hệ thống AI hiện đại, kháng lại những thói quen làm suy yếu phán đoán hoặc làm mờ trách nhiệm, và luôn ghi nhớ rằng AI là một công cụ chúng ta chọn sử dụng, không phải là một thẩm quyền mà chúng ta phải phục tùng.