OpenBSD từ chối hệ thống tập tin Ext4 "vibe-coded" do lo ngại bản quyền

10 tháng 4, 2026·4 phút đọc

Một bản vá triển khai hệ thống tập tin ext4 được tạo bởi AI đã gây tranh cãi trong cộng đồng OpenBSD. Nhà sáng lập dự án đã từ chối mã nguồn này do tình trạng bản quyền mơ hồ và nguy cơ vi phạm giấy phép GPL.

OpenBSD từ chối hệ thống tập tin Ext4 "vibe-coded" do lo ngại bản quyền

Vào ngày 17 tháng 3, Thomas de Grivel đã đăng tải một bản triển khai hệ thống tập tin ext4 lên danh sách thư openbsd-tech. Theo de Grivel, bản triển khai này cung cấp khả năng đọc và ghi đầy đủ và vượt qua công cụ kiểm tra hệ thống tập tin e2fsck; tuy nhiên, nó không hỗ trợ tính năng ghi nhật ký (journaling). Mặc dù đoạn mã này bao gồm nhiều tuyên bố bản quyền, nhưng không đề cập đến cách thức nó được viết ra.

Mã nguồn và hệ thốngMã nguồn và hệ thống

Trong một bài đăng trên blog, de Grivel đã tiết lộ nguồn gốc thực sự của đoạn mã: nó được tạo ra bởi Mô hình Ngôn ngữ Lớn (LLM). Điều này đã ngay lập tức dấy lên những lo ngại trước đoán về khả năng đoạn mã này bị coi là sản phẩm phái sinh từ bản triển khai Linux (được cấp phép GPL). Thực tế là LLM này gần như chắc chắn đã được đào tạo trên mã và tài liệu ext4 của Linux càng làm tăng thêm nghi ngờ.

Vấn đề về bản quyền và giấy phép

Việc đưa mã nguồn được cấp phép GPL vào OpenBSD là điều cực kỳ không được khuyến khích. Christian Schulte đã bày tỏ lo ngại về việc "ô nhiễm giấy phép" (license contamination). Tuy nhiên, Theo de Raadt, người sáng lập OpenBSD, chỉ ra rằng việc viết lại các cấu trúc và thuật toán là được luật bản quyền cho phép; đó là cách tính tương thích hoạt động. Tuy nhiên, điều này không có nghĩa là De Raadt ủng hộ việc hợp nhất đóng góp này.

Giao diện dòng lệnhGiao diện dòng lệnh

Theo góc nhìn của OpenBSD, tình trạng bản quyền của mã do AI tạo ra thực sự là một vấn đề phức tạp. Lý do đơn giản là không ai biết rõ tình trạng đó là gì, hoặc thậm chí liệu một bản quyền có thể tồn tại trên đoạn mã đó hay không. Nếu không có bản quyền, dự án không thể cấp quyền phân phối lại mã nguồn. De Raadt giải thích rằng các công ty AI hiện không được công nhận là có khả năng cấp phép theo các điều ước hoặc luật bản quyền hiện hành.

"Cho đến nay, hệ thống Bản quyền không có cách nào để đầu ra của một tập tin không do con người tạo ra chứa sự cấp phép mà dự án OpenBSD cần để thực hiện kết hợp và phân phối lại."

Rủi ro của "Vibe-Coding"

Cuộc tranh luận còn kéo dài đến chất lượng của mã do AI tạo ra. Một số nhận xét cho rằng đoạn mã trông ổn nếu bạn thích phong cách C của 25 năm trước, nhưng các cấu trúc dữ liệu không rõ ràng và không có sự tách biệt thực sự giữa các thuật toán cấp cao và cấu trúc dữ liệu cấp thấp.

Mối lo ngại lớn hơn với việc LLM viết mã là khả năng bảo trì (maintainability). Các công cụ như Claude thường có điểm mù khi tái cấu trúc và dọn dẹp mã trong quá trình phát triển. Điều này dẫn đến việc phiên bản đầu tiên có thể trông đẹp mắt, nhưng nếu tiếp tục phát triển một cách thụ động, mã nguồn sẽ nhanh chóng đi sai hướng.

Kết cục không thể tránh khỏi

De Raadt đã tuyên bố rõ ràng: "cơ hội chúng tôi chấp nhận mã mới như vậy với tình trạng Bản quyền đáng ngờ như vậy là bằng không". Sau sự việc này, de Grivel đã thêm một ghi chú vào blog rằng ông sẽ xóa tất cả mã do LLM tạo ra, chỉ giữ lại mã do chính mình viết. Tuy nhiên, việc thuyết phục người khác rằng các phiên bản sau đó thực sự do ông viết sẽ là một trận chiến khó khăn. Ông cũng thừa nhận rằng việc "fork OpenBSD" có thể dễ dàng hơn.

Câu chuyện này là một lời cảnh tỉnh cho xu hướng ngày càng tăng của những người sử dụng LLM để tạo ra hàng ngàn dòng mã và gửi kết quả cho các dự án mã nguồn mở mà không minh bạch về nguồn gốc. Nó đặt ra những bẫy pháp lý và kỹ thuật tiềm tàng cho tương lai của phát triển phần mềm.

Bài viết được tổng hợp và biên soạn bằng AI từ các nguồn tin tức công nghệ. Nội dung mang tính tham khảo. Xem bài gốc ↗