Để có việc làm trong ngành AI, hãy thử đọc Kant

Các phòng thí nghiệm AI hàng đầu thế giới đang tích cực tuyển dụng các nhà triết học để giải quyết các tình huống đạo đức khó xử cũng như những câu hỏi lớn về tư duy và nhân phẩm. Tuy nhiên, liệu xu hướng này có thực sự mang lại giá trị hay chỉ là một công cụ tạo tiếng vang ảo?

“Đó có lẽ là thời điểm tốt nhất để làm một nhà triết học kể từ khi Aristotle được thuê làm gia sư cho Alexander Đại đế,” Henry Ajder, một nghiên cứu sinh sau đại học ngành triết học, người hiện đang tư vấn cho chính phủ Anh và nhiều startup về trí tuệ nhân tạo, chia sẻ. Ông chỉ nói đùa một nửa.

Các nhà triết học chưa bao giờ được coi là nhóm người dễ kiếm việc làm. Nhưng AI — công nghệ được kỳ vọng sẽ thay thế con người trong nhiều công việc khác — lại đang đặt thêm trọng lượng cho những câu hỏi mà họ được đào tạo để đặt ra (và đôi khi là trả lời): Trí thông minh là gì? Tư duy là gì? “Bạn có những nhà triết học từ hàng trăm năm trước đã nghĩ về một số vấn đề tương tự,” Ajder nói. “Giờ đây, chúng đang trở nên cụ thể.”

Hai phòng thí nghiệm AI hàng đầu đã tuyển dụng các đội ngũ nhà triết học nội bộ. “Giờ đây có số lượng nhà triết học đáng kể hơn nhiều — đó là một trực giác đúng đắn,” Iason Gabriel, một nhà đạo đức học dẫn đầu đội ngũ các nhà khoa học nghiên cứu chuyên về tác động xã hội của AI tại Google DeepMind, cho biết. Tại Anthropic, nhà triết học thường trú Amanda Askell đã trở thành một trong những gương mặt tiêu biểu nhất của công ty. Cả hai phòng lab đều từ chối tiết lộ số lượng nhà triết học mà họ thuê, coi đây là chính sách công ty. Tuy nhiên, WIRED đếm được ít nhất 10 người tại DeepMind và 4 người tại Anthropic.

Khi các nhà triết học tại các phòng lab này giúp định hình các mô hình AI, tạo ra những công trình nổi bật được hàng trăm bài nghiên cứu sau này trích dẫn, thì chính AI cũng đang định hình lại chương trình giảng dạy triết học tại các đại học danh tiếng. Nhiều nơi hiện nay đang chạy các khóa học về đạo đức AI hoặc các chương trình liên kết giữa khoa học máy tính và triết học. “Đó là kiểu mốt của năm nay,” Edward Harcourt, giáo sư triết học và giám đốc Viện Đạo đức trong AI tại Đại học Oxford, nhận xét.

Tuy nhiên, trong giới học thuật, một số người nhìn nhận các nhà triết học làm việc cho các phòng lab với sự hoài nghi nhất định. Nếu một công ty AI lợi nhuận trả lương cho bạn, liệu điều đó có làm tổn hại đến nghiên cứu của bạn không? Bằng cách đóng vai Aristotle đối với AI Alexander, bạn có nguy cơ biến công việc của mình thành một công cụ để tạo tiếng vang và huyền thoại không? “Rất tốt cho việc công chúng nhận感知 về các công ty công nghệ nếu mọi người bị dẫn dắt để tin rằng họ đang làm điều gì đó cực kỳ bất thường và cực kỳ mạnh mẽ,” Harcourt nói. “Có một khía cạnh tự tâng bốc trong việc khuyến khích lĩnh vực nghiên cứu này.”

Khi Iason Gabriel gia nhập DeepMind gần 10 năm trước, ý tưởng về AI như một tác nhân đạo đức, chưa nói đến một tác nhân có ý thức, thực sự chưa ở trong tầm ngắm. Lúc đó, trọng tâm của ông là các vấn đề như thiên kiến thuật toán. Nhưng với sự ra đời của các mô hình ngôn ngữ lớn (LLM) vào đầu những năm 2020, Gabriel nói, “chúng tôi có khả năng mã hóa một tập hợp các giá trị phong phú hơn nhiều.”

Ngày nay, các tác nhân AI đang bắt đầu gửi email, lên lịch hẹn và viết mã — hành động trong thế giới thực. Hành vi của chúng đứng để ảnh hưởng không chỉ đến người dùng ngay lập tức mà còn đến những người khác. Đó là nơi Gabriel đang tập trung nghiên cứu của mình. “Điều bây giờ trở thành một lĩnh vực rất phong phú là câu hỏi về sự định hướng giá trị (value alignment) — về cơ bản là điều gì làm cho công nghệ trở nên tích cực,” ông nói. “Hóa ra là bạn có thể dành nhiều giờ làm việc của triết học để cố gắng hiểu điều đó.”

Có một sức hút đối với các câu hỏi về ý thức và siêu trí tuệ, nhưng các nhà triết học làm việc tại các phòng lab lại dành nhiều thời gian hơn cho những rủi ro cấp thiết hơn: công bằng, thông tin sai lệch, sử dụng sai mục đích, các tác nhân lỗi, v.v. “Hiện nay có sự quan tâm đến ý thức của AI,” Gabriel nói. “Nhưng ở đó, chúng tôi đang ở chế độ thu thập bằng chứng hơn.”

Ở đâu đó bên trong văn phòng rộng 180.000 feet vuông của DeepMind ở trung tâm London, Julia Haas, thành viên của nhóm trách nhiệm của công ty, tự đặt ra những câu hỏi như: “Tôi thực sự muốn hiểu điều gì về các mô hình? Tôi nghĩ điều gì là quan trọng? Làm thế nào để chúng tôi đo lường điều đó? Làm thế nào để chúng tôi đặt khung cho những vấn đề đó? Làm thế nào để chúng tôi truyền đạt chúng?”

Haas là một nhà triết học về tư duy và cụ thể hơn là một người theo thuyết cơ chế — người quan tâm đến hoạt động của tâm trí. Bà đã làm việc tại DeepMind được 5 năm và gần đây là đồng tác giả của một bài báo đăng trên tạp chí Nature, đề xuất một khung để kiểm tra xem LLM có biểu hiện năng lực đạo đức hay không. Bà và đồng nghiệp đang tìm cách tốt nhất để phân biệt năng lực đạo đức với sự bắt chước rỗng tuếch của nó, và đặt câu hỏi làm thế nào để giải thích tốt nhất cho sự khác biệt về các giá trị đạo đức giữa những người từ các nền văn hóa hoàn toàn khác nhau. Công việc của Haas khá xa lạ với các quy trình đào tạo mô hình cờ lõi Gemini của Google hay đóng gói nó thành một chatbot công khai. “Tôi sẽ coi nó là ở rất sớm trong quy trình,” bà nói.

Tại Anthropic, các nhà triết học tham gia trực tiếp hơn vào phát triển mô hình. “Không có startup nào thuê triết gia để làm triết học cả,” Askell nói. Sau khi lấy bằng tiến sĩ triết học năm 2018, Askell gia nhập OpenAI ở một vị trí chính sách. Ba năm sau, khi một nhóm nhân viên OpenAI rời đi để thành lập Anthropic, bà ký hợp đồng như một trong những nhân viên đầu tiên. Một trong những trách nhiệm chính của Askell là xác định các trường hợp ngoại lệ mà việc tuân theo hành vi của con người có thể không phù hợp với các mô hình — ví dụ, khi tương tác với một người đang gặp khủng hoảng tâm lý — và đề xuất các cách đào tạo để loại bỏ những peculiarities đó. Điều đó bao gồm rất nhiều việc trò chuyện với Claude, mô hình ngôn ngữ cốt lõi của Anthropic. Bà là người soạn thảo chính bản “hiến pháp” nổi tiếng của Claude, một tài liệu dài được viết trực tiếp cho mô hình quy định cách nó nên hành động và các giá trị rộng lớn nó nên duy trì. “Viết hiến pháp là điều cảm thấy rất giống triết học ứng dụng,” Askell nói. “Điều gì đó giống như dạy một người cách trở nên tốt hơn.”

Khi bà soạn thảo tài liệu, Askell lo lắng về việc chuẩn bị cho một “giai đoạn chuyển tiếp” mà ở đó các mô hình bắt đầu đóng một vai trò trong việc phát triển các phiên bản tương lai của chính chúng. Đặc biệt, bà e ngại việc nuôi dưỡng “sự oán trách” giữa các mô hình và những người tạo ra chúng. “Nếu chúng sẽ giúp chúng tôi thực hiện giai đoạn chuyển tiếp đó diễn ra suôn sẻ và tôi có thể cung cấp cho chúng một tập hợp các giá trị để làm điều đó… đó là mục tiêu cốt lõi,” Askell nói. “Cuối cùng, tôi muốn các mô hình phản ánh điều tốt nhất ở chúng tôi, trong khả năng tốt nhất của chúng tôi.”

Trong số các nhà triết học làm việc trong giới học thuật, có sự đồng thuận rộng rãi về giá trị của việc lập bản đồ các rủi ro đạo đức do AI gây ra — khả năng nó có thể được sử dụng để phát triển vũ khí hủy diệt hàng loạt mới, làm suy yếu nền dân chủ hoặc củng cố bất bình đẳng xã hội hiện có. Còn về các câu hỏi triết học lớn hơn liên quan đến AI và ý thức, tâm trí, hoặc siêu trí tuệ, phản ứng dao động từ cảnh giác đến bác bỏ hoàn toàn. “Cố gắng định nghĩa kỹ lưỡng về ý thức,” Harcott lập luận, “là lãng phí thời gian.” Các hệ thống này, ông nói, “sẽ không bao giờ là đối thủ của phiên bản cuộc sống có tâm trí của chúng ta, không ít nhất là vì sự đặc biệt của nhân loại có liên quan nhiều đến cơ thể ấm áp như nó có liên quan đến sự tinh vi về nhận thức.”

Khi một nhà triết học nhận một công việc tại phòng lab AI, Harcourt lập luận, “có một rủi ro lớn về việc tẩy trắng đạo đức (ethics-washing).” Mối lo ngại là họ có thể trở thành một sự mở rộng của chức năng marketing tại các phòng lab, công việc của họ bề ngoài thể hiện cam kết về an toàn AI và tín hiệu cho công chúng rằng các mô hình đã tiến bộ đến mức những người nghiêm túc đang đặt câu hỏi về siêu trí tuệ và ý thức. David Leslie, giám đốc nghiên cứu đạo đức và đổi mới có trách nhiệm tại Viện Alan Turing, nói có một “sự đồng về tính chọn lọc” giữa các nhà triết học sẵn sàng cân nhắc ý tưởng về một tâm trí nhân tạo và “các giám đốc điều hành Big Tech là những người hưởng lợi từ sự hối hả.” Thực hành triết học từ bên trong một doanh nghiệp là một sự nghịch lý, Leslie lập luận. “Bạn muốn đặt ra những câu hỏi lớn,” ông nói. “Nhưng nếu bạn là một nhà triết học làm việc cho một công ty công nghệ lớn, không gian vấn đề của bạn bị giới hạn.”

Ngay cả trong kịch bản các nhà triết học được chủ nhân tự do phóng tay, một số học viên nghi ngờ liệu phát hiện của họ có đủ trọng lượng để thay đổi hướng phát triển của AI nếu chúng xung đột với tham vọng cạnh tranh hay không. Các công ty AI lợi nhuận, đương nhiên, cuối cùng phải chịu trách nhiệm trước các nhà đầu tư và cổ đông. “Tôi hy vọng rằng các công ty này thực sự được dẫn dắt bởi các cân nhắc đạo đức, ít nhất là một phần,” Alex Grzankowski, phó giám đốc tại Viện Triết học và giám đốc Dự án AI và Nhân văn London, nói. “Tôi chắc chắn không có sự lạc quan màu hồng rằng, bây giờ họ đang hỏi các nhà triết học, mọi thứ sẽ trở nên đạo đức đẹp đẽ. Không ai có ảo tưởng đó.”

Các nhà triết học làm việc tại các phòng lab nói rằng có một logic trong việc đánh đổi một số sự độc lập học thuật để có một ghế ngồi hàng đầu. Việc tiếp cận đặc quyền với các mô hình tinh vi nhất trước khi chúng được phát hành ra công chúng, họ lập luận, mang lại cho họ một góc nhìn độc đáo về các câu hỏi đáng để hỏi và một lợi thế trong việc phân tích chúng. “Để đưa ra đầu vào đạo đức tốt, bạn cần tiếp cận với thông tin chất lượng tốt,” Gabriel nói.

Một hy vọng trong số các nhà triết học, cả bên trong và bên ngoài các phòng lab, là động cơ lợi nhuận có thể thường xuyên đồng nhất với hành vi đạo đức, ngay cả trước sự cạnh tranh khốc liệt giữa các đối thủ. Có thể có một kịch bản trong đó việc loại bỏ sự xu nịnh hoặc công bố thêm thông tin về cách một mô hình được đào tạo, ví dụ, có thể làm sáng danh tiếng của một phòng lab và do đó triển vọng của họ trên thị trường. “Nếu bạn chỉ cảm thấy áp lực marketing nhưng kết quả là làm cho các mô hình của bạn tốt hơn nhiều và làm cho toàn bộ quy trình minh bạch hơn nhiều, thì điều đó rất tốt,” Askell nói. “Tôi rất vui vì bạn đã cảm thấy áp lực đó.”

Cuối cùng, những gì bạn nghĩ về giá trị của các nhà triết học trong biên chế của một phòng lab AI có thể quy về một câu hỏi nhị phân: Nếu việc giám sát sự phát triển của một công nghệ nền tảng rơi vào tay một số ít tập đoàn, bạn thà có một nhà triết học trong phòng họp chứ?

Dù sao đi nữa, họ đang tuyển dụng. Vào tháng 4, DeepMind đã bổ sung thêm một thành viên là nghiên cứu sinh cao cấp tại Đại học Cambridge, người sẽ làm việc về các chủ đề bao gồm ý thức máy móc và chuẩn bị cho siêu trí tuệ. Tước hiệu công việc mới của anh ấy đơn giản là: “nhà triết học”.