Bản đồ và lãnh thổ trong kỷ nguyên AI: Kỹ năng ngầm để đọc hiểu Mô hình Ngôn ngữ
Bài viết so sánh Mô hình Ngôn ngữ (LM) như những tấm bản đồ của thực tại, đang dần trở nên chi tiết đến mức định hình lại chính lãnh thổ mà chúng mô phỏng. Tác giả nhấn mạnh rằng người dùng cần phát triển một kỹ năng ngầm tinh tế để phân biệt khi nào nên tin tưởng vào AI và khi nào cần tự mình kiểm chứng thông tin.
Jorge Luis Borges từng có một câu chuyện ngắn về một đế chế, nơi các nhà bản đồ học không ngừng phóng to các tấm bản đồ cho đến khi chúng đạt đúng kích thước của chính đế chế đó. Các thế hệ sau, ít bị mê hoặc hơn, đã nhận ra sự vô dụng của nó và bỏ mặc tấm bản đồ đó cho thời tiết. Bản đồ có giá trị chính vì nó là sự rút gọn. Khi việc theo đuổi sự trung thực phá hủy khả năng nén dữ liệu, nó cũng phá hủy luôn mục đích của bản đồ.
Trong bối cảnh công nghệ hiện nay, Mô hình Ngôn ngữ (LM) chính là những tấm bản đồ của chúng ta.
LM đã trở nên cực kỳ tốt, đến mức chúng không chỉ là sự đại diện hữu ích cho lãnh thổ (thực tại), mà theo nhiều cách đang bắt đầu định hình lại chính lãnh thổ đó. Điều này có nghĩa là chúng ta cần trở nên giỏi hơn trong việc "đọc bản đồ" mà không mất đi kết nối với lãnh thổ thực. Chúng ta cần nhiều cách hơn để duy trì sự tương tác khi đọc và làm việc với chúng. Phần lớn tương tác chuyên nghiệp của chúng ta với máy tính hiện nay được trung gian hóa qua các LM: khi xem xét một mã nguồn mới, khi đọc một bài báo khoa học, hoặc khi chuẩn bị cho một nhiệm vụ. Đây là một lớp trừu tượng mà chúng ta khó có thể tránh khỏi, nhưng nó thay đổi những kỹ năng mà chúng ta cần thành thạo.
Bốn giai đoạn của sự mô phỏng
Jean Baudrillard, viết vào năm 1981, đã đề xuất bốn giai đoạn mô tả cách các sự đại diện liên quan đến thực tại. Các giai đoạn này áp dụng rất tốt cho các LM, và theo một cách độc đáo vì LM dường như chiếm lĩnh các giai đoạn khác nhau cùng một lúc, tùy thuộc vào trường hợp sử dụng.
Ở giai đoạn một, hình ảnh là một bản sao trung thực của thực tại. LM về mặt kỹ thuật được thiết kế theo cách này: được huấn luyện để dự đoán và tái tạo các mẫu trong văn bản do con người tạo ra càng chính xác càng tốt.
Ở giai đoạn hai, hình ảnh che giấu và bóp méo thực tại. LM cũng làm điều này. Những gì bạn nhận được là một phiên bản đã được làm mượt, trung bình hóa của lãnh thổ. Những sự bóp méo tinh tế rất dễ bị bỏ lỡ chính vì bề mặt của nó trông rất mạch lạc. Ví dụ, hãy hỏi một LM về nguyên nhân khủng hoảng tài chính 2008, bạn sẽ nhận được câu trả lời về thế chấp subprime và bãi bỏ quy định. Câu trả lời có vẻ uy tín, nhưng nó thực chất gần giống với một sự đồng thuận được đánh giá theo mức độ phổ biến hơn là các tranh luận chưa được giải quyết của các nhà kinh tế.
Ở giai đoạn ba, hình ảnh che giấu sự vắng mặt của thực tại. Một khi bạn có một sự xấp xỉ đủ tốt, việc tương tác với lãnh thổ thực trở nên ít cần thiết hơn. Bạn có thể ngừng kiểm tra các nguồn vì câu trả lời trông có vẻ đúng. Bạn ngừng khám phá vì lời khuyên cảm thấy đủ đầy. Hoạt động trông có vẻ giống như nghiên cứu, nhưng thực chất nó đã bị rỗng ruột.
Giai đoạn bốn, khi sự đại diện không còn liên quan gì đến thực tại, là giai đoạn khó lường hơn. Chúng ta có thể chưa đến đó, nhưng nó có thể xuất hiện khi phần lớn nội dung dùng để huấn luyện các hệ thống mới chủ yếu là đầu ra của các hệ thống trước đó, hoặc khi "cuộc trò chuyện" trở thành nguồn kiến thức chính của mọi người.
Bản đồ độc nhất vô nhị
LM không giống như các bản đồ khác. Một bản đồ địa lý trông giống nhau đối với mọi người đọc. Nhưng LM thì không. Đầu ra thay đổi dựa trên những sửa đổi nhỏ đối với câu lệnh (prompt), và độ tinh tế của phản hồi của mô hình có tương quan với trình độ học vấn của người đưa ra câu lệnh. Tấm bản đồ này nằm rất nhiều trong "con mắt của người ngắm nhìn".
Nó cũng có tính dẻo mà các bản đồ tĩnh không bao giờ có: bạn có thể phóng to, thu nhỏ các chủ đề, tiếp cận chúng từ các góc độ khác nhau và kết nối thông tin xuyên các lĩnh vực. Điều này thực sự hữu ích. Nó dọn dẹp sự lộn xộn và tạo không gian để thực sự suy ngẫm về một dự án nghiên cứu phức tạp hay một mã nguồn khổng lồ.
Tuy nhiên, khác với bất kỳ bản đồ nào trước đây, bản đồ này cũng đang trở thành đối tượng nghiên cứu chính nó. Trong nhiều lĩnh vực nghiên cứu AI, các mô hình được khám phá không phải như bản đồ của thực tại, mà như một thứ gì đó hữu ích theo đúng nghĩa của nó.
Kỹ năng ngầm: Đọc qua bản đồ để thấy lãnh thổ
Đây là phần thú vị nhất. Sử dụng các bản đồ này tốt, biết khi nào nên tin tưởng chúng, khi nào cần phóng to, khi nào cần dừng lại và chạm vào lãnh thổ thực, là một kỹ năng. Và phần lớn đó là một kỹ năng ngầm (tacit skill).
Kiến thức ngầm ở đây không chỉ là việc phát hiện ra những ảo giác (hallucinations) rõ ràng. Nó tinh tế hơn: một cảm giác rằng điều gì đó chưa được xác minh, một sự bất an về một tuyên bố mà bạn không chắc dữ liệu có hỗ trợ hay không, hay một cảm giác rằng đầu ra quá mượt mà. Đó là loại cảm giác mà một bác sĩ ý nghĩa khi nói bệnh nhân "trông có vẻ ốm" trước khi kết quả xét nghiệm quay lại, hoặc một lập trình viên khi nói về "mùi code" (code smell).
Michael Polanyi có một ví dụ rất hay về một người mù học cách sử dụng một cây thăm dò. Ban đầu, bạn cảm thấy tác động của cây thăm dò lên tay mình. Nhưng khi bạn học được, nhận thức của bạn sẽ dịch chuyển: bạn ngừng cảm thấy cây thăm dò và bắt đầu cảm thấy những gì cây thăm dò chạm vào. Cảm giác gần trở thành nhận thức xa. Sử dụng LM tốt cũng có thể giống như thế: ban đầu bạn chú ý đến chính đầu ra (điều này có đúng không?). Theo thời gian, nếu bạn phát triển kỹ năng, bạn bắt đầu chú ý thông qua đầu ra để đến "lãnh thổ" đằng sau nó.
Kỹ năng này được học qua thực hành và khó có thể được mã hóa thành các quy tắc hoặc danh sách kiểm tra. Một bài viết về bản đồ lại đi đến kết luận rằng kỹ năng quan trọng nhất để điều hướng chúng không thể nào được bản đồ hóa chính nó.
Các LM hiện tại chúng ta sử dụng là những mô hình tệ nhất mà chúng ta sẽ từng được dùng. Chúng sẽ tốt hơn (trong mọi khía cạnh). Kỹ năng đọc bản đồ tốt, việc duy trì sự bất an mang tính sản xuất đó, sẽ quan trọng hơn vào năm sau so với bây giờ.
Những người bản đồ học của Borges đã say mê việc vẽ bản đồ đến mức quên mất mục đích của nó. Thế hệ sau, ít bị mê hoặc hơn, đã bỏ mặc bản đồ cho thời tiết. Cả hai phản ứng đó dường như đều không đúng. Ở đâu đó giữa sự ám ảnh và sự thờ ơ, có một thực hành tinh tế trong việc sử dụng các bản đồ này tốt, và việc trung thực về cách mối quan hệ của chúng ta với chúng liên tục thay đổi.



