Unicode 18.0.0 Beta: Bản cập nhật lớn mang đến hơn 13.000 ký tự mới

Công nghệ27 tháng 5, 2026·3 phút đọc

Liên minh Unicode vừa phát hành bản beta của Tiêu chuẩn Unicode phiên bản 18.0.0, bổ sung 13.047 ký tự mới và nâng tổng số ký tự lên 172.848. Bản cập nhật này bao gồm 4 hệ thống chữ viết mới, các thay đổi về chính sách ổn định và cập nhật cho các Tiêu chuẩn Kỹ thuật Unicode đồng bộ.

Unicode 18.0.0 Beta: Bản cập nhật lớn mang đến hơn 13.000 ký tự mới

Liên minh Unicode (Unicode Consortium) vừa công bố bản beta của Tiêu chuẩn Unicode phiên bản 18.0.0, đánh dấu một bước tiến quan trọng trong việc mã hóa và hiển thị văn bản trên toàn cầu. Phiên bản này thay thế tất cả các phiên bản trước đó và mang đến hàng loạt thay đổi lớn mà các nhà phát triển phần mềm cần lưu ý.

Tổng quan về các thay đổi chính

Unicode 18.0.0 bổ sung tổng cộng 13.047 ký tự mới, nâng tổng số ký tự trong tiêu chuẩn lên con số ấn tượng 172.848. Sự gia tăng này không chỉ mở rộng khả năng hỗ trợ ngôn ngữ mà còn bao gồm các cập nhật kỹ thuật quan trọng ảnh hưởng đến cách hệ thống xử lý văn bản.

Hầu hết các ký tự mới được thêm vào các khối (blocks) mới, tuy nhiên cũng có sự bổ sung vào nhiều khối ký tự hiện có. Để xem chi tiết các thay đổi này, người dùng có thể tham khảo các biểu đồ mã thay đổi (delta code charts).

Các hệ thống chữ viết mới được mã hóa

Một trong những điểm nổi bật nhất của Unicode 18.0 là việc mã hóa 4 hệ thống chữ viết (scripts) hoàn toàn mới:

  • Jurchen: Một hệ thống chữ tượng hình lớn.
  • Seal: Một hệ thống chữ tượng hình lớn khác.
  • Proto-Cuneiform: Trong phiên bản 18.0, chỉ có các chữ số cổ đại (archaic digits) được thêm vào; việc bổ sung thêm các ký hiệu khác được dự kiến cho các phiên bản tương lai.
  • Chisoi: Một hệ thống chữ mới với tập hợp các chữ số thập phân riêng biệt.

Việc thêm bộ chữ số thập phân cho Chisoi là một thay đổi quan trọng. Các nhà phát triển phần mềm xử lý giá trị số và định dạng số học cần cập nhật logic để hỗ trợ bộ ký tự này.

Cập nhật kỹ thuật và ảnh hưởng đến triển khai

Ngoài việc mở rộng kho tàng ký tự, Unicode 18.0.0 còn mang lại những thay đổi về mặt kỹ thuật có thể yêu cầu sửa đổi đối với các bản triển khai hiện tại:

  • Chính sách ổn định mới: Một chính sách ổn định thuộc tính mới đã được thêm vào cho ID_Compat_Math_StartID_Compat_Math_Continue.
  • Yêu cầu tuân thủ (Conformance): Phần tuân thủ của tiêu chuẩn đã được cập nhật với các định nghĩa và yêu cầu mới liên quan đến việc sử dụng bộ chọn biến thể (variation selectors) và chuỗi biến thể (variation sequences).
  • Cập nhật đồng bộ: Năm Tiêu chuẩn Kỹ thuật Unicode (UTS) được phiên bản hóa đồng bộ với Tiêu chuẩn Unicode cũng đã được cập nhật lên phiên bản 18.0.

Các kỹ sư được khuyến khích tham khảo phần M của tài liệu để nắm rõ các tác động chính khi nâng cấp từ các phiên bản tiêu chuẩn trước đó.

Tài nguyên và Emoji

Để hỗ trợ cộng đồng kỹ thuật, Liên minh Unicode đã cung cấp đầy đủ các tài nguyên đi kèm phiên bản 18.0.0:

  • Thông số kỹ thuật cốt lõi (Core specification) có sẵn để xem trực tuyến dưới dạng các trang web theo chương và dưới dạng file PDF lưu trữ dung lượng 13 MB.
  • Các biểu đồ mã (Code charts) bao gồm biểu đồ theo khối, biểu đồ thay đổi và biểu đồ hợp nhất là những phần ổn định của bản phát hành này.
  • Cơ sở dữ liệu ký tự Unicode (Unicode Character Database) đã được cập nhật với các tệp dữ liệu mới.

Ngoài ra, các thay đổi liên quan đến emoji cũng được cập nhật trong biểu đồ emoji Unicode 18.0 và danh sách "Emoji Recently Added, v18.0".

Phiên bản chính thức của Unicode Standard, Version 18.0.0, dự kiến sẽ được xuất bản vào năm 2026 với ISBN 978-1-936213-NN-N.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗