Biến Claude thành một Nhà Hóa học: Khả năng phân tích phổ NMR vượt trội

Anthropic đã công bố nghiên cứu mới cho thấy Claude, đặc biệt là phiên bản Opus 4.7, có khả năng dự đoán phổ NMR và xác định cấu trúc phân tử ngang bằng hoặc vượt trội so với các phần mềm chuyên dụng như ChemDraw. Đây là bước tiến quan trọng trong việc ứng dụng AI đa phương thức vào nghiên cứu hóa học, giúp tự động hóa các nhiệm vụ phân tích dữ liệu tốn thời gian.

Anthropic đang hợp tác với các nhà hóa học hàng đầu thế giới để biến Claude thành một trợ lý đắc lực hơn trong phòng thí nghiệm. Trong một bài đăng mới, công ty đã chia sẻ kết quả nghiên cứu đầu tiên trong nỗ lực này, chứng minh rằng mô hình AI của họ có thể thực hiện các nhiệm vụ phân tích hóa học phức tạp — cụ thể là phân tích phổ NMR (phổ cộng hưởng từ hạt nhân) — với độ chính xác ấn tượng.

Hóa học và AI

Thách thức trong việc dịch ngôn ngữ hóa học

Công việc của một nhà hóa học đòi hỏi sự linh hoạt trong việc chuyển đổi giữa các dạng biểu diễn khác nhau của cùng một phân tử: từ bản phác thảo tay trên bảng trắng, đến dữ liệu đọc từ máy đo, chuỗi truy vấn cơ sở dữ liệu và các ký hiệu kỹ thuật trong bằng sáng chế. Mỗi dạng biểu diễn này mã hóa cùng một thông tin hóa học cơ bản nhưng đòi hỏi các kỹ năng thông dịch khác nhau.

Việc hiểu rõ phân tử đang làm việc là cực kỳ quan trọng. Một sự thay đổi nhỏ trong liên kết hóa học có thể biến glucose thành fructose, hoặc lật một phân tử thành hình ảnh phản chiếu (mirror image) có thể biến một loại thuốc an thần thành tác nhân gây quái thai. Tuy nhiên, việc dịch chuyển giữa các dạng biểu diễn này là tốn thời gian và khó mở rộng quy mô, đặc biệt khi cơ sở dữ liệu hóa học CAS hiện đã lưu trữ hơn 290 triệu chất và tăng thêm khoảng 15.000 chất mới mỗi ngày.

AI được định vị rất tốt để giải quyết gánh nặng nghiên cứu này. Các mô hình tiên phong hiện nay là đa phương thức (multimodal) và có khả năng lập luận rõ ràng. Chúng có thể đọc cấu trúc hóa học trực tiếp từ hình ảnh hoặc bản phác thảo thay vì phụ thuộc vào cơ sở dữ liệu phân tử đã được biên tập sẵn.

Đối đầu với phần mềm chuyên dụng: Dự đoán phổ NMR

Trong nghiên cứu này, Anthropic đã tập trung vào NMR spectroscopy — một trong những kỹ thuật phân tích quan trọng nhất nhưng cũng tốn nhiều thời gian nhất trong hóa học tổng hợp. Mục tiêu là xem Claude hoạt động tốt như thế nào so với các phần mềm chuyên dụng mà các nhà hóa học vẫn dùng hàng ngày như ChemDraw và MestReNova.

Nhóm nghiên cứu đã kiểm tra ba mô hình Claude (Opus 4.7, Opus 4.6, Sonnet 4.6) trên 20 hợp chất được lấy từ các bản in trước (preprints) của hóa học tổng hợp được công bố sau thời điểm cắt giảm dữ liệu huấn luyện của các mô hình. Điều này đảm bảo rằng mô hình không thể "học vẹt" câu trả lời.

Nhiệm vụ "dự đoán thuận" (forward prediction) yêu cầu các công cụ dự đoán vị trí của các đỉnh (peaks) hydro và carbon trên phổ NMR 1D dựa trên cấu trúc phân tử đầu vào (dưới dạng chuỗi SMILES).

Biểu đồ kết quả so sánh

Kết quả cho thấy Claude Opus 4.7 hoạt động xuất sắc:

Về độ chính xác vị trí đỉnh: Trên hydro, Opus 4.7 có sai số trung bình chỉ ±0.079 ppm — thấp hơn một nửa ngưỡng dung sai chấp nhận được (±0.20 ppm). Trên carbon, nó về cơ bản ngang bằng với MestReNova.
Về hình dạng đỉnh: Opus 4.7 khớp với mô hình chia tách (splitting pattern) được báo cáo trong thực nghiệm thường xuyên hơn bất kỳ công cụ nào khác.
Tính nhất quán: Opus 4.7 cho thấy sự ổn định cao nhất qua các lần chạy thử nghiệm.

Khả năng xác định cấu trúc ngược

Thách thức lớn hơn và thú vị hơn là "dự đoán ngược" (inverse prediction): xác định cấu trúc của một phân tử chỉ dựa trên phổ NMR và công thức phân tử. Đây là nhiệm vụ mà các phần mềm hiện tại thường để lại cho con người xử lý.

Khi được cung cấp phổ và công thức chính xác, Opus 4.7 đã phục hồi thành công tất cả 8 cấu trúc đơn giản trong mọi lần thử nghiệm. Đối với 7 mục tiêu phức tạp hơn (như các vòng hợp nhất, spirocycles), khi có thêm gợi ý về cấu trúc vật liệu ban đầu, mô hình đã đưa ra cấu trúc đúng trong cả 3 lần chạy cho 4 trường hợp và đúng 2/3 lần cho các trường hợp còn lại.

Cấu trúc phân tử

Điều đáng chú ý là Claude thực hiện được việc này mà không cần tinh chỉnh (fine-tuning) chuyên sâu cho hóa học, hoạt động như một mô hình đa mục đích chung.

Hạn chế và hướng đi tương lai

Mặc dù kết quả rất hứa hẹn, Anthropic cũng chỉ ra một số hạn chế của nghiên cứu:

Quy mô đánh giá còn nhỏ (chỉ 20 hợp chất).
Một số loại dàn hóa học (chemical scaffolds) chưa được kiểm tra.
Các thí nghiệm 2D và lập thể hóa học (stereochemistry) nằm ngoài phạm vi của bài viết này.

Tuy nhiên, mục tiêu cuối cùng của Anthropic khiêm tốn nhưng thực tế: Claude bắt đầu hỗ trợ có ý nghĩa các nhà hóa học trong công việc dịch thuật, ghi nhớ và tích hợp dữ liệu hàng ngày. Trong tương lai, họ tập trung vào các nút thắt cổ chai khác như:

Lập luận phản ứng và tổng hợp (retrosynthesis).
Giải thích cơ chế phản ứng.
Hiểu tài liệu hóa học chuyên sâu.

Việc một mô hình ngôn ngữ chung có thể cạnh tranh với phần mềm hóa học chuyên dụng mở ra khả năng tự động hóa các quy trình phân tích dữ liệu tốn thời gian, giúp các nhà hóa học tập trung hơn vào sự phán xét và sáng tạo của họ.