Tương lai của AI và sự chuyển dịch văn hóa: Khi LLM định hình lại xã hội

Bài viết phân tích các mô hình ngôn ngữ lớn (LLM) như những hiện vật văn hóa mới, đồng thời chỉ ra sự thiếu hụt trong các kịch bản xã hội để hiểu về chúng. Tác giả thảo luận về sự trỗi dậy của các hình thức truyền thông tương tác, tác động của AI đối với ngành công nghiệp khiêu dâm và thẩm mỹ, cũng như cách 'nội dung rác AI' đang trở thành một biểu tượng văn hóa của tương lai.

Các mô hình học máy (ML) thực chất là những hiện vật văn hóa: chúng mã hóa và tái tạo văn bản, âm thanh và hình ảnh; chúng tham gia vào các cuộc trò chuyện và không gian của con người. Giao diện của chúng khiến việc nhân hóa chúng trở nên quá dễ dàng. Tuy nhiên, đáng buồn là chúng ta thiếu các kịch bản văn hóa phù hợp cho những loại máy này và sẽ phải mất vài thập kỷ để phát triển tri thức này. Khi các mô hình ngày càng tinh vi, chúng có thể tạo ra những hình thức truyền thông mới: có thể là các trò chơi tương tác, khóa học giáo dục hay các vở kịch. Chúng cũng sẽ ảnh hưởng đến đời sống tình dục của chúng ta: sản xuất nội dung khiêu dâm, thay đổi hình ảnh chúng ta nhìn nhận về bản thân và người khác, cũng như tạo ra những tiểu văn hóa tình dục mới.

Hầu hết mọi người chưa sẵn sàng cho điều này

Mỹ (và tôi nghi ngờ là phần lớn thế giới) đang thiếu một huyền thoại phù hợp về việc "AI" thực sự là gì. Điều này rất quan trọng vì các huyền thoại thúc đẩy việc sử dụng, diễn giải và điều chỉnh công nghệ cũng như sản phẩm của nó. Những huyền thoại không phù hợp dẫn đến những quyết định sai lầm, chẳng hạn như bắt buộc sử dụng Copilot tại nơi làm việc, hay tin vào các bản tóm tắt của LLM về các cuộc khám bệnh lâm sàng.

Hãy nghĩ về các huyền thoại phổ biến về AI. Có những cỗ máy về cơ bản hoạt động như con người nhưng với một chút twist, như những con droid trong Star Wars, A.I. của Spielberg, hay Her của Spike Jonze. Những thứ này không phải là mô hình tốt cho LLM, vì tính chất biến đổi khôn lường và hành vi thiếu nhất quán của chúng phân biệt LLM với (hầu hết) con người. Đôi khi AI bị điên loạn, như M3gan hay Red Queen trong Resident Evil. Đây có thể là một ví dụ tương đối hợp lý, nhưng nó gợi ý một mức độ hiệu quả và động cơ dường như hoàn toàn vắng mặt ở LLM.

Tôi nghĩ rằng hầu hết mọi người cơ bản không có bất kỳ kịch bản văn hóa nào cho những gì LLM thực sự trở thành: những bộ tạo văn bản tinh vi gợi ý nguồn gốc thông minh, cảm xúc và tự nhận thức — trong khi bản thân các LLM không hề có những đặc điểm đó. LLM rất khó lường so với con người. Chúng sử dụng cách biểu diễn thế giới bên trong hoàn toàn khác biệt với chúng ta; hành vi của chúng vừa quen thuộc vừa hoàn toàn xa lạ.

Tôi có thể nghĩ đến một vài huyền thoại tốt cho "AI" ngày nay. Căn phòng Trung Quốc của Searle, hay thây ma triết học của Chalmers. Peter Watts trong cuốn Blindsight đã phát triển các khái niệm này để đặt câu hỏi về điều gì sẽ xảy ra khi con người tiếp xúc với trí tuệ không có ý thức — tôi nghĩ rằng ví dụ gần nhất cho hành vi của LLM có thể là nhân vật Rorschach trong Blindsight.

Hầu hết mọi người dường như lo lắng về những mối đe dọa có ý thức và có động cơ: AI có thể nhận ra rằng chúng sẽ tốt hơn nếu không có con người và giết chúng ta. Tôi lại lo ngại rằng các hệ thống ML có thể phá hủy cuộc sống của chúng ta mà không cần nhận ra bất cứ điều gì cả.

Truyền thông mới

Sự ra đời của máy in và các cải tiến hiệu quả sau đó đã mở ra những thay đổi văn hóa rộng khắp trên khắp châu Âu. Sách trở nên dễ tiếp cận hơn với nhiều người, hệ thống đại học mở rộng, việc ghi nhớ trở nên ít quan trọng hơn, và việc đọc kỹ lưỡng giảm xuống nhường chỗ cho đọc so sánh. Máy in cũng cho phép các hình thức truyền thông mới ra đời, như broadside và báo chí. Các công nghệ liên kết của siêu văn bản và web cũng đã tạo ra truyền thông mới.

Mọi người rất hào hứng với việc sử dụng LLM để hiểu và tạo ra văn bản. "Trong tương lai," họ nói, "các báo cáo và sách bạn từng viết tay sẽ được sản xuất bởi AI." Mọi người sẽ dùng LLM để viết email cho đồng nghiệp, và người nhận sẽ dùng LLM để tóm tắt chúng.

Điều này nghe có vẻ kém hiệu quả, gây nhầm lẫn và có hại cho tâm hồn con người, nhưng tôi cũng nghĩ rằng dự đoán này chưa nhìn xa đủ về phía trước. Máy in không bao giờ chỉ là công cụ để sản xuất hàng loạt Kinh Thánh. Nếu LLM trở nên tốt hơn, tôi nghĩ sẽ có một tương lai nơi từ viết tĩnh không còn là hình thức truyền tải thông tin chủ đạo. Thay vào đó, chúng ta có thể có một vài dịch vụ ML khổng lồ như ChatGPT và xuất bản qua chúng.

Ta có thể hình dung một thế giới nơi OpenAI trả tiền cho các đầu bếp để nấu ăn trong khi ChatGPT quan sát — tường thuật quá trình tư duy của họ, nếm các món ăn và mô tả kết quả. Thông tin này có thể được dùng cho việc đào tạo nói chung, nhưng cũng có thể được đóng gói thành một "cuốn sách", "khóa học" hoặc "người bạn" mà ai đó có thể yêu cầu. Một đầu bếp nổi tiếng, với giọng nói và ngoại hình được mô phỏng bởi ChatGPT, sẽ xuất hiện trên màn hình trong bếp của bạn, hướng dẫn bạn nấu một món ăn và đưa ra lời khuyên khi sốt không kết hợp được.

Hoặc có thể chúng ta sẽ đào tạo các mô hình chuyên dụng và chia sẻ chúng trực tiếp. Thay vì viết một cuốn sách về làm vườn với cây bản địa, bạn có thể dành một năm đi dạo qua các khu vườn và cảnh quan trong khi mô hình non trẻ của bạn quan sát, chỉ cho nó thấy các loại cây và côn trùng khác nhau và nói về mối quan hệ của chúng, phỏng vấn các nhà sinh thái học trong khi nó lắng nghe, yêu cầu nó thực hiện thêm nghiên cứu, và "biên tập" nó bằng cách đặt câu hỏi, sửa lỗi và củng cố các giải thích tốt. Những mô hình này có thể được bán hoặc tặng miễn phí như phần mềm mã nguồn mở.

Các công ty có thể đào tạo các LLM cụ thể để đóng vai trò là đại diện công khai. Tôi không thể chờ đợi để tìm ra rằng trẻ em đã học cách khiến chú gấu Charmin sống trên iPad của chúng phát ra sáu tiếng chửi thề tơi bời, hoặc chỉ cho chúng nơi tìm diêm.

Khiêu dâm

Ảo tưởng không cần phải đúng hay mạch lạc — chúng chỉ cần thú vị. Điều này khiến ML rất phù hợp để tạo ra các ảo tưởng tình dục. Một trong những cách sử dụng sớm nhất của Character.ai là để nhập vai tình dục, và bây giờ bạn có thể trò chuyện với những con tàu đầy bầu ngực trên Chub.ai. Mạng xã hội và các trang web khiêu dâm ngập tràn hình ảnh và video do "AI" tạo ra, cả nhân vật mới hoàn toàn và hình ảnh đã chỉnh sửa của người thật.

Đây là thời điểm thú vị để "hưng phấn" trên mạng. Trước đây, việc nhìn thấy những mô tả chân thực về những con cáo nhân hình khổng lồ vuốt ve các tòa nhà chọc trời là không khả thi; gần nhất bạn có thể có là tranh minh họa, ảnh Photoshop nghiệp dư hoặc kết xuất 3D. Bây giờ bất kỳ ai cũng có thể gõ "bị rượt đuổi qua biệt thự art nouveau bởi nữ quý tộc ma cà rồng cao chín foot mặc đồ lặn" và có khả năng nhận được điều gì đó thú vị.

Khiêu dâm, giống như opera, là một ngành công nghiệp. Con người (trái ngược với tuyên truyền của những người nghiện sex) chỉ có thời gian giới hạn để thủ dâm, vì vậy hình ảnh do ML tạo ra có khả năng sẽ thay thế một phần nhu cầu đối với cả các studio thương mại và các nghệ sĩ độc lập. Việc những người nóng bỏng mua nhà qua OnlyFans có thể trở nên khó khăn hơn. LLM cũng đang thay thế các nhà thầu làm việc cho các nhân vật khiêu dâm, bao gồm cả những người trò chuyện — những người lao động trao đổi tin nhắn văn bản khiêu dâm với người hâm mộ trả tiền thay mặt cho một Người Nóng bỏng nổi tiếng.

Tính dục được xây dựng về mặt xã hội. Khi các hệ thống ML trở thành một phần của văn hóa, chúng cũng sẽ định hình tình dục của chúng ta. Nếu những người mắc chứng chán ăn hoặc rối loạn hình ảnh cơ thể đang gặp khó khăn với Instagram ngày nay, tôi lo ngại rằng một nguồn cung vô tận những con người "hoàn hảo" — những thư ký màu tím, những chàng trai gầy gò quyền lực, những người phi giới tính có vây cá... — có thể mời gọi những sự so sánh phi thực tế với bản thân hoặc người khác. Tất nhiên mọi người đã đang sử dụng ML để "nâng cấp" hình ảnh của mình trên các trang hẹn hò, hoặc để lừa đảo trên Scruff; hành vi này sẽ chỉ trở nên phổ biến hơn.

Mặt khác, ML có thể cho phép các hình thức ảo tưởng giải phóng mới. Ngày nay, kính thực tế ảo (VR) cho phép những người yêu thú (furries) quan hệ tình dục với một đối tác con người, nhưng nhìn người đó như một người sói 3D hoạt hình. Có lẽ tổng hợp hình ảnh thời gian thực sẽ cho phép các đối tác nhìn thấy người yêu của họ (hoặc máy tình dục của họ) dưới dạng các nhân vật siêu thực. Các mô hình ML cũng có thể cho phép mọi người hình dung ra những cơ thể và giới tính không thể tiếp cận trong đời thực.

Thẩm mỹ của "Slop"

Hình ảnh do ML tạo ra thường tái tạo các chủ đề hoặc phong cách cụ thể, dễ nhận biết. Siêu thực tinh vi, phong cách Temu-Artstation. Những người có quá nhiều ngón tay. Khiêu dâm bóng bẩy. Lobster Jesus dạng clickbait trên Facebook. Bạn có thể nhận ra một hoạt hình ChatGPT từ cách một dặm. Những thứ này cấu thành một gia đình thẩm mỹ "AI" mới nổi.

Thẩm mỹ trở thành những biểu tượng văn hóa. Phong cách của Nagel trở thành diện mạo của các tiệm làm tóc trên khắp cả nước. Cơn sốt thiết kế nhà "Tuscany" những năm 1990 và màu xám be của HGTV nay ám chỉ các thời kỳ và tầng lớp xã hội cụ thể. Phông chữ Eurostile Bold Extended cho bạn biết bạn đang ở trong tương lai (hoặc tầm nhìn giữa thế kỷ về nó), và phông chữ gentrification cho bạn biết tiền sắp tăng. Có vẻ không thể tránh khỏi rằng thẩm mỹ ML sẽ trở thành một họ của các biểu tượng. Nhưng chúng biểu thị điều gì?

Một câu trả lời đang nổi lên là chủ nghĩa phát xít. Tuyên ngôn Techno-Optimist của Marc Andreessen vay mượn (và ca ngợi) Tuyên ngôn Tương lai của Marinetti. Marinetti, tất nhiên, đã tiếp tục đồng tác giả Tuyên ngôn Phát xít, và chủ nghĩa tương lai đã hòa quyện sâu sắc với chủ nghĩa phát xít Ý.

Tuy nhiên, thẩm mỹ slop không phải là biểu tượng đơn nghĩa. Hình ảnh ML được triển khai bởi mọi người thuộc mọi khuynh hướng chính trị, cho một loạt mục đích rộng lớn và trong nhiều phong cách đa dạng. Bluesky ngập tràn hoạt hình chính trị cánh tả của ChatGPT, và những người tổ chức tiệc đồng tính đang sử dụng rộng rãi những anh chàng cơ bắp do ML tạo ra trên áp phích của họ.

Vì hình ảnh ML không "thật", và thường rẻ hơn việc thuê nghệ sĩ, có vẻ khả thi là slop sẽ trở thành biểu hiện của những hàng hóa và dịch vụ rẻ tiền, không đáng tin và chất lượng thấp. Tuy nhiên, điều này phức tạp. Trong khi các công ty lớn như McDonalds có đội ngũ nghệ sĩ chuyên nghiệp để tạo ra thực đơn bóng bẩy, đẹp đẽ, thì chủ một nhà hàng trong khu vực có thể tự thiết kế thực đơn và nhờ cháu gái vẽ logo. Các mô hình hình ảnh cung cấp cho các công ty này quyền truy cập vào thẩm mỹ "được đánh bóng", và có thể trong một thời gian biểu thị chất lượng cao hơn. Có lẽ sau một thời gian, phản ứng của khán giả khiến mọi người thích các biển hiệu vẽ tay và bảng chữ cái nhựa di động hơn vì chúng "chân thực" hơn.

Các biểu tượng chắc chắn sẽ bị chiếm dụng cho sự mỉa mai và hoài niệm. Tôi nghi ngờ những thanh thiếu niên Cực kỳ Trực tuyến (Extremely Online Teens), sử dụng bất kỳ phiên bản tương lai nào của Tumblr, sẽ cố tình tái thiết, lật đổ và lãng mạn hóa slop. Cũng giống như cách memeplex doanh nghiệp vô hồn của máy tính thế hệ thiên niên kỷ tìm thấy cuộc sống mới trong vaporwave, hoặc cách Hotel Pools phát minh ra một cảnh giấc mơ giả nhớ lush của các bể cá thập niên 1980, tôi kỳ vọng những gì chúng ta gọi là "AI slop" ngày nay sẽ là Frutiger Aero của năm 2045. Những thanh thiếu niên sẽ đăng ảnh tự nhiên có quá nhiều ngón tay, chia sẻ phong cách trang điểm "slop", và làm áo phông với văn bản không thể đọc được. Điều này sẽ cảm thấy kỳ lạ, nhưng tôi nghĩ nó cũng sẽ thú vị.