ORPilot và Đại diện Trung gian (IR): Chìa khóa cho Tối ưu hóa AI có thể Tái tạo và Di động

Bài viết khám phá vai trò của Đại diện Trung gian (IR) trong ORPilot, giải quyết vấn đề về tính tái tạo và di động cho các mô hình tối ưu hóa AI sản phẩm thực tế, giúp tách biệt trí tuệ mô hình hóa khỏi quy trình tính toán.

Trong bài viết trước, tôi đã giới thiệu bốn đổi mới cốt lõi của ORPilot — một công cụ mã nguồn mở sử dụng LLM cho Nghiên cứu Vận hành (OR) hướng tới sản xuất. Trong số đó, Đại diện Trung gian (Intermediate Representation - IR) là yếu tố quan trọng nhất, giúp phân biệt ORPilot với các nguyên mẫu học thuật và trang bị cho nó tiềm năng trở thành một công cụ cấp độ sản xuất. IR giải quyết hai vấn đề mà môi trường sản xuất quan tâm nhất: tính tái tạo (reproducibility) và tính di động (portability). Trong bài viết này, chúng ta sẽ đi sâu vào cấu trúc IR của ORPilot.

Vấn đề của các công cụ tối ưu hóa AI hiện tại

Có một vấn đề mà ít ai bàn đến khi thảo luận về các mô hình tối ưu hóa do AI tạo ra: Điều gì xảy ra sau lần giải quyết đầu tiên?

Bạn đã có mô hình hoạt động và nhận được giải pháp tối ưu. Nhưng ba tuần sau, bạn cần chạy lại nó với dữ liệu nhu cầu đã cập nhật. Hoặc đồng nghiệp trên một máy khác cần tái tạo kết quả đó. Hoặc công ty quyết định chuyển từ Gurobi sang một trình giải quyết (solver) mã nguồn mở để tiết kiệm chi phí bản quyền. Với hầu hết các công cụ LLM-for-OR hiện có, câu trả lời cho tất cả các câu hỏi này đều giống nhau: bạn phải bắt đầu từ đầu, gọi LLM lại, trả phí API, tạo lại mã solver và hy vọng nhận được cấu trúc mô hình giống hệt.

Tuy nhiên, ORPilot cung cấp một giải pháp thay thế thông qua Đại diện Trung gian (IR).

IR là gì?

IR là một lược đồ JSON có kiểu dữ liệu, độc lập với trình giải quyết (solver-agnostic), nắm bắt cấu trúc toán học hoàn chỉnh của một mô hình tối ưu hóa. Nó không phải là mã tối ưu hóa, mà là bản thân mô hình, được biểu diễn dưới một hình thức độc lập với bất kỳ trình giải quyết cụ thể nào.

Cấu trúc IR của ORPilot có năm phần chính:

Sets (Tập hợp): Các bộ sưu tập thực thể được đặt tên, chẳng hạn như Workers (Nhân viên), Tasks (Nhiệm vụ), Plants (Nhà máy).
Parameters (Tham số): Dữ liệu số được lập chỉ mục từ các tệp CSV, liên kết với miền (domain) và tên cột cụ thể.
Variables (Biến số): Các biến quyết định với kiểu (liên tục, nhị phân, nguyên), miền, giới hạn và các cờ cấu trúc.
Objective (Hàm mục tiêu): Cây biểu thức tượng trưng trên các biến và tham số (tổng, hiệu, tích, v.v.).
Constraints (Ràng buộc): Các ràng buộc tượng trưng có tên, bao gồm miền, cây biểu thức và ý nghĩa (bằng, lớn hơn hoặc bằng, v.v.).

Ví dụ: Bài toán Phân công Công việc - Nhiệm vụ

Hãy xem xét bài toán phân công bốn nhân viên cho bốn nhiệm vụ. Mỗi cặp (nhân viên, nhiệm vụ) có một chi phí lấy từ tệp CSV. Mục tiêu là giảm thiểu tổng chi phí phân công.

Dưới đây là cách IR mô tả các thành phần chính:

Sets (Tập hợp): Trường "sets" chỉ định các thành viên đến từ đâu. ORPilot yêu cầu tất cả các thành viên tập hợp phải nằm trong một tệp duy nhất là sets.csv. Quy ước này giúp tập hợp dữ liệu chính ở một nơi và bắt lỗi chính tả trước khi trình biên dịch tạo ra các tập hợp rỗng.

Parameters (Tham số): Trường "parameters" liên kết dữ liệu với mô hình. Ví dụ, assignment_cost (chi phí phân công) được liên kết với tệp assignment_costs.csv. Trường quan trọng nhất ở đây là index_columns, cho phép trình biên dịch xác định chính xác các cột nào trong CSV tương ứng với các tập hợp miền, tránh việc tải sai dữ liệu một cách thầm lặng.

Variables (Biến số): Trường "variables" xác định các quyết định. Biến assign là biến nhị phân được lập chỉ mục qua Workers và Tasks. Các cờ cấu trúc như exclude_diagonal (loại trừ đường chéo) hoặc domain_filter (bộ lọc miền) giúp xử lý các trường hợp phức tạp như mô hình định tuyến nơi không có địa điểm nào di chuyển đến chính nó.

Constraints (Ràng buộc): Đây là nơi IR khác biệt nhất so với tệp mã. Ràng buộc được lưu trữ dưới dạng cây biểu thức, không phải chuỗi ký tự. Mỗi ràng buộc có miền (các tập hợp để lặp), biểu thức (cây đệ quy), ý nghĩa (=, <=, >=) và vế phải (RHS).

Ví dụ, ràng buộc "một nhiệm vụ cho mỗi nhân viên" sử dụng indexed_sum để tổng hợp các biến phân công. Một điểm quan trọng là việc sử dụng bí danh (alias) để tránh "che khuất" (shadowing) biến vòng lặp, đảm bảo tính chính xác của tổng.

Objective (Hàm mục tiêu): Hàm mục tiêu thường là một tổng được lập chỉ mục. Một quy tắc quan trọng trong IR là tránh lồng ghép phép trừ ở vế phải. Ví dụ, subtract(A, subtract(B, C)) về mặt toán học sẽ thành A - (B - C) = A - B + C, làm đảo ngược dấu của C. Điều này dẫn đến kết quả tối ưu sai. ORPilot có một bộ xác thực ngữ nghĩa để bắt lỗi này và yêu cầu LLM sửa lại thành chuỗi phẳng từ trái sang phải.

Từ IR đến Mã Solver

Trình biên dịch IR là một phần mềm xác định — không có LLM nào tham gia vào quá trình này. Với cùng một tệp ir.json và cùng các tệp dữ liệu CSV, nó luôn tạo ra mã solver giống hệt nhau. Trình biên dịch hiện hỗ trợ 5 backend: PuLP, Pyomo, OR-Tools, Gurobi và CPLEX.

Việc chuyển đổi backend không yêu cầu thay đổi mô hình. Bạn có thể lưu trữ ir.json cùng với dữ liệu và tái tạo chính xác bất kỳ kết quả quá khứ nào mà không cần gọi API nào cả. Chỉ cần một lệnh đơn giản để chuyển từ Gurobi sang PuLP:

orpilot compile-ir output/ir.json --solver pulp --run

Quy trình Biên dịch IR

Khi bạn có tệp ir.json hợp lệ, ORPilot cung cấp một quy trình biên dịch nhẹ nhàng: ir.json + Dữ liệu CSV -> Trình biên dịch IR -> Mã Solver -> Thực thi. Quy trình này hoàn toàn không có cuộc gọi LLM nào, giúp nó nhanh, rẻ và hoàn toàn xác định.

Bộ xác thực Ngữ nghĩa IR

Trước khi IR được lưu và biên dịch, ORPilot chạy một bộ xác thực ngữ nghĩa để bắt các lỗi mô hình hóa mà cấu trúc JSON đúng nhưng sai về mặt toán học. Bộ xác thực hiện xử lý ba loại lỗi chính mà LLM thường mắc phải:

Lỗi dấu cân bằng tồn kho: Phát hiện khi tất cả các biến dòng chảy nằm cùng một phía của phương trình cân bằng (ví dụ: inv = inflow + outflow thay vì inv = inflow - outflow).
Thiếu ràng buộc khởi tạo: Nếu tồn tại ràng buộc cân bằng có độ trễ thời gian, bộ xác thực yêu cầu một biến thể _init tương ứng cho giai đoạn thời gian đầu tiên.
Phép trừ lồng nhau trong hàm mục tiêu: Như đã đề cập ở trên, việc lồng các phép trừ sẽ làm đảo ngược dấu của các chi phí, làm sai lệch giá trị mục tiêu.

Khi xác thực thất bại, thông báo lỗi cụ thể sẽ được gửi lại cho LLM dưới dạng lời nhắc thử lại (retry prompt) có mục tiêu.

Tại sao IR quan trọng cho Phân tích Giả định (What-If Analysis)?

Tính tái tạo và tính di động của IR mở rộng tự nhiên sang phân tích giả định có hệ thống.

Thay đổi dữ liệu: Nếu câu hỏi chỉ sửa đổi các giá trị tham số, bạn chỉ cần cập nhật các tệp CSV. IR JSON không đổi. Chạy trình biên dịch với dữ liệu mới và giải lại. Đây là thao tác không gọi LLM.
Thay đổi cấu trúc: Nếu câu hỏi sửa đổi ràng buộc hoặc thêm ràng buộc mới, bạn có thể chỉnh sửa tệp IR JSON trực tiếp. Vì IR là một tài liệu có cấu trúc và được xác thực lược đồ, các chỉnh sửa này được địa phương hóa và dễ dàng hơn là tìm kiếm trong hàng trăm dòng mã.

Bức tranh lớn hơn

IR giải quyết một điều cơ bản về mối quan hệ giữa AI và phần mềm sản xuất: Đầu ra của AI cần có thể xác minh, di chuyển và bền vững. Một tệp mã solver do LLM tạo ra là một khối không rõ ràng. IR tách biệt trí tuệ mô hình hóa (cần LLM) khỏi bước tính toán (không cần LLM). Khi hiện vật JSON đó tồn tại và được xác thực, nó thuộc về bạn, không phải về LLM. Đây là lựa chọn thiết kế khiến ORPilot phù hợp để triển khai trong môi trường sản xuất thực tế.