Liệu Web dành cho máy móc (llm.txt) có phải là thứ chúng ta vẫn tìm kiếm cho con người?
Một người dùng chia sẻ việc thường xuyên thủ công thêm `/llm.txt` vào các URL để đọc nội dung sạch, không quảng cáo vốn dành cho AI. Điều này dấy lên câu hỏi: Liệu cuộc cách mạng AI có vô tình sửa chữa lại Web để trở nên thân thiện hơn với con người, hay các trình duyệt cần cập nhật để hỗ trợ định dạng này?
Trong bối cảnh World Wide Web hiện nay ngày càng bị "nặng nề" bởi các yếu tố marketing, quảng cáo và giao diện phức tạp, nhiều người dùng bắt đầu cảm thấy mệt mỏi khi tìm kiếm thông tin cốt lõi. Điều này khiến một số người hoài cổ về sự đơn giản của các giao thức web cũ như Gopher hay Gemini. Tuy nhiên, một xu hướng thú vị đang nổi lên: Con người đang bắt đầu "xài ké" nội dung được viết riêng cho Máy móc và AI.
Gần đây, một cuộc thảo luận trên Hacker News đã thu hút sự chú ý khi người dùng chia sẻ thói quen thủ công thêm đường dẫn /llm.txt vào cuối các trang web họ truy cập. Thay vì đọc giao diện web rực rỡ, họ chọn đọc các tệp văn bản thuần túy (plain text) hoặc Markdown vốn được tối ưu hóa cho các Mô hình Ngôn ngữ Lớn (LLM). Thật ngạc nhiên, nội dung này lại trực diện, súc tích và rõ ràng hơn rất nhiều so với những gì con người thường thấy trên giao diện người dùng (UI) chuẩn.
"Tôi phát hiện ra mình thường xuyên thêm thủ công
/llm.txtvào hầu hết các trang web tôi ghé thăm vì tôi thấy nội dung dành cho LLM rất thẳng thắn và rõ ràng."
Tuy nhiên, rào cản lớn nhất hiện nay là các trình duyệt phổ biến như Chrome chưa hỗ trợ hiển thị trực tiếp định dạng Markdown, khiến việc đọc trực tiếp các tệp này trở nên khó chịu về mặt thị giác. Đây là một nghịch lý khi công nghệ trình duyệt lại tụt hậu so với cách chúng ta muốn tiêu thụ thông tin.
Liệu cuộc cách mạng AI có phải là "chìa khóa" để sửa chữa lại Web cho con người như một tác dụng phụ? Tiêu chuẩn /llm.txt, dù không được đưa ra bởi các ông lớn AI nhưng đang được cộng đồng áp dụng (ví dụ như Laravel), cho thấy một nhu cầu thực sự về việc chuẩn hóa dữ liệu sạch.
Trong khi các trang web thông thường bị quét dữ liệu (scrape) một cách cực đoan đến mức trở thành vấn đề bảo mật và quản lý tài nguyên, thì các tệp llms.txt lại được thiết kế để cung cấp thông tin một cách minh bạch. Có lẽ, giải pháp cho một web "sạch" hơn dành cho con người nằm ở chỗ chuẩn hóa dữ liệu cho máy móc tốt hơn. Hoặc đơn giản là chúng ta cần một tiện ích mở rộng (plugin) trên trình duyệt để tự động chuyển đổi các tệp Markdown này thành dạng dễ đọc, một việc mà các AI như Claude hoàn toàn có thể tạo lập tức (zero-shot) ngay hôm nay.



