Anthropic đề xuất cơ chế phối hợp toàn cầu để "tạm dừng" phát triển AI khi rủi ro tăng cao

Công ty Anthropic đã kêu gọi các phòng thí nghiệm AI hàng đầu thế giới thiết lập một cơ chế phối hợp cho phép tạm dừng phát triển trí tuệ nhân tạo nếu nguy cơ mất kiểm soát trở nên hiện hữu. Động thái này nhằm ngăn chặn các tác nhân độc hại lợi dụng thời gian chậm trễ để vượt lên phía trước trong cuộc đua công nghệ.

Anthropic, công ty đứng sau chatbot Claude, vừa đưa ra một đề xuất gây chú ý: các công ty AI hàng đầu cần có phương thức phối hợp để có thể tạm dừng phát triển các hệ thống AI tiên tiến. Cảnh báo đưa ra là công nghệ này đang phát triển quá nhanh đến mức con người có nguy cơ mất quyền kiểm soát.

Trong một bài đăng trên blog, Anthropic cho rằng khi AI ngày càng hoàn thiện khả năng thực hiện các nhiệm vụ, "thế giới sẽ tốt hơn nếu có lựa chọn làm chậm hoặc tạm dừng" sự phát triển này. Viện nghiên cứu nội bộ của Anthropic cho biết họ có kế hoạch khám phá vấn đề này trong sự hợp tác với các bên khác và "thực hiện các hành động" giúp xây dựng hệ thống cho sự chậm lại hoặc tạm dừng đáng tin cậy.

Rủi ro của việc AI tự cải thiện bản thân

Theo Anthropic, các mô hình AI đang ngày càng nhanh hơn trong việc thực hiện các tác vụ phần mềm như viết mã. Dựa trên xu hướng hiện tại và với đủ sức mạnh tính toán, một hệ thống AI có thể tự thiết kế và phát triển phiên bản kế nhiệm của chính nó - một khái niệm được gọi là "tự cải thiện đệ quy" (recursive self-improvement).

Anthropic AI Military

Mặc dù đây là một cột mốc công nghệ lớn mang lại lợi ích cho khoa học và y tế, Anthropic thừa nhận rằng nó "cũng có thể làm tăng rủi ro con người mất kiểm soát đối với các hệ thống AI".

Sự khác biệt trong quan điểm quản lý

Trong khi Anthropic tập trung vào sự phối hợp giữa các công ty, đối thủ OpenAI lại có quan điểm khác. Trong một báo cáo được công bố vào thứ Tư, OpenAI lập luận rằng "các chính phủ dân chủ - chứ không phải các công ty tư nhân hành động một mình - cuối cùng phải là người quyết định các quy tắc, cơ chế bảo vệ và trách nhiệm giải trình".

"Quan điểm của chúng tôi là các quyết định về tốc độ đổi mới AI không nên để cho bất kỳ phòng lab, công ty hay nhóm lợi ích đặc biệt nào," OpenAI tuyên bố.

Mối đe dọa từ AI trong an ninh mạng

Đề xuất của Anthropic xuất hiện sau một cảnh báo khác từ nhóm nghiên cứu tại Đại học Toronto. Họ đã chứng minh cách các công cụ AI có thể được sử dụng để tạo ra một loại "sâu" (worm) AI mới, thích nghi chiến lược tấn công khi lan truyền từ thiết bị này sang thiết bị khác và chiếm đoạt một mạng lưới tính toán khổng lồ.

Nicholas Papernot, nhà nghiên cứu liên quan, cho biết chi phí thực hiện các cuộc tấn công mạng này đã trở nên rất thấp. Bất kỳ thiết bị nào kết nối internet, kể cả chiếc laptop cũ trong tầng hầm ít được kiểm tra, đều có thể trở thành bàn đạp để tấn công các mục tiêu giá trị cao như ngân hàng, bệnh viện hay lưới điện.

SecurityWeek

Papernot đồng ý rằng cần có nhiều sự hợp tác hơn giữa các công ty, cơ quan chính phủ và các nhà nghiên cứu học thuật để phát triển các biện pháp đối phó khi các công cụ tấn công mạng được hỗ trợ bởi AI gia tăng việc tìm kiếm lỗ hổng máy tính.

Cần một cơ chế toàn cầu

Anthropic nhấn mạnh rằng sự phối hợp đề xuất sẽ cho phép các phòng lab AI tiên tiến xác minh rằng các đối thủ toàn cầu thực sự đã dừng hoặc làm chậm công việc của họ. Điều này nhằm đảm bảo "một tác nhân xấu không thể sử dụng danh nghĩa của việc chậm lại phối hợp để bí mật vượt lên phía trước".

Công ty cho rằng một cơ chế toàn cầu là cần thiết vì nếu không, việc làm chậm phát triển AI có thể để cho "những người ít thận trọng nhất" bắt kịp, gia tăng áp lực lên các công ty và chính phủ trong việc đưa ra các quyết định khó khăn về an toàn AI.

Động thái này diễn ra trong bối cảnh Anthropic và nhà sản xuất ChatGPT là OpenAI đang chạy đua để bán cổ phiếu ra công chúng, với một đợt IPO có thể định giá Anthropic gần một nghìn tỷ USD.