QCon AI Boston 2026: Sáu phiên thảo luận trọng tâm về việc triển khai AI trong môi trường sản xuất

Phần mềm21 tháng 5, 2026·6 phút đọc

QCon AI Boston 2026 sắp khai mạc và vé dự kiến sẽ bán hết. Sáu phiên thảo luận được giới thiệu dưới đây sẽ tập trung giải quyết thách thức lớn nhất hiện nay: thu hẹp khoảng cách giữa bản demo AI ấn tượng và việc vận hành AI thực tế trong sản xuất.

QCon AI Boston 2026: Sáu phiên thảo luận trọng tâm về việc triển khai AI trong môi trường sản xuất

QCon AI Boston 2026 (diễn ra từ ngày 1 đến 2 tháng 6 tại Đại học Boston) chỉ còn hai tuần nữa là khai mạc và hiện tại vé tham dự đã gần hết sạch. Với lịch trình bao gồm hơn 40 phiên thảo luận, sự kiện năm nay tập trung vào một vấn đề cấp thiết: Kỹ thuật AI trông như thế nào sau giai đoạn demo, khi các nhóm kỹ thuật đã dành hai năm để tìm ra những phần nào của nguyên mẫu không thể vận hành được trong thực tế.

Dưới đây là sáu phiên thảo luận nổi bật tại QCon AI Boston 2026 đi sâu vào việc đưa AI vào sản xuất nghiêm túc.

Giữ cho ChatGPT nhanh chóng trong kỷ nguyên AI Agent

Martin Spier, Chuyên gia Hiệu suất ChatGPT tại OpenAI

Trong bài diễn văn chính vào ngày đầu tiên, Martin Spier sẽ giải quyết một quan niệm sai lầm phổ biến: độ trễ của ứng dụng AI không đơn thuần là vấn đề của GPU.

Một yêu cầu duy nhất từ người dùng có thể đi qua công việc của máy khách, tải cuộc hội thoại, lắp ráp ngữ cảnh, tách từ (tokenization), định tuyến, suy luận (inference), truyền phát và quan sát. Bất kỳ lớp nào trong số đó cũng có thể trở thành nút thắt cổ chai.

Một nửa vấn đề còn lại mới mẻ hơn. Lập trình tác nhân (Agentic coding) cho phép các nhóm phát hành sản phẩm nhanh hơn, điều này cũng đồng nghĩa với việc các sự cố về hiệu suất có thể tích tụ nhanh hơn. Martin sẽ trình bày cách OpenAI đang chuyển đổi kỹ thuật hiệu suất sang điều tra do tác nhân vận hành, với các công cụ đo từ xa và telemetry mà các tác nhân có thể đọc trực tiếp.

Kỹ thuật ngữ cảnh tại LinkedIn: Xây dựng lớp ngữ cảnh tổ chức cho AI Agents với MCP

Ajay Prakash, Kỹ sư Phần mềm Cao cấp tại LinkedIn

Các tác nhân mã hóa (coding agents) hoạt động tốt ngay khi mới mở hộp cho đến khi chúng phải thực hiện công việc thực tế bên trong một công ty cụ thể.

Chúng không biết các dịch vụ của bạn. Chúng không biết các khung nội bộ của bạn. Chúng không biết hệ thống dữ liệu nào quan trọng, quy trình làm việc nào là tiêu chuẩn, hay các quy ước nào đã được xây dựng qua nhiều năm thực hành kỹ thuật.

Phiên thảo luận của Ajay Prakash sẽ xem xét cách LinkedIn tiếp cận vấn đề đó với CAPT, một lớp ngữ cảnh dựa trên MCP cho các tác nhân AI. Kiến trúc rất quan trọng, nhưng phần hữu ích hơn có thể là câu chuyện triển khai trong tổ chức: điều gì đã xảy ra khi LinkedIn cố gắng triển khai MCP trên toàn bộ kỹ thuật, điều gì không hoạt động ngay từ đầu, và hệ thống đã phát triển như thế nào. Các kết quả được báo cáo bao gồm việc phân loại vấn đề nhanh hơn 70% và hơn 500 kỹ năng do cộng đồng viết.

Bộ điều khiển AI Agent: Mặt phẳng điều khiển, Bất biến và Ranh giới phê duyệt cho AI Agent sản xuất

Vinoth Govindarajan, Nhân viên Kỹ thuật tại OpenAI

Bài nói chuyện của Vinoth Govindarajan có một trong những lập trường rõ ràng nhất trong chương trình: các tác nhân có vẻ tự chủ, nhưng độ tin cậy đến từ bộ điều khiển bao quanh mô hình.

Bộ điều khiển đó bao gồm các mặt phẳng điều khiển (control planes), trạng thái phiên, thực thi đơn người ghi, điều tiết, ranh giới công cụ, đường dẫn phê duyệt và khả năng kiểm toán. Đây không phải là các tính năng của mô hình. Đây là các mối quan tâm của hệ thống.

Phiên thảo luận sử dụng OpenClaw như một nghiên cứu điển hình, nhưng mô hình tư duy cơ bản là có thể chuyển đổi: các sự kiện đi vào hệ thống, trạng thái được khôi phục theo từng phiên, thực thi bị hạn chế, công cụ bị giới hạn và mọi hành động quan trọng đều để lại dấu vết kiểm toán.

Xây dựng khung đánh giá có thể tái sử dụng cho sản phẩm AI Agent

Susan Chang, Nhà khoa học Dữ liệu Chính tại Elastic

Đội ngũ của Susan đã vận hành một tác nhân AI hướng tới người dùng trong sản xuất được gần hai năm. Thời gian này rất quan trọng vì hầu hết các câu chuyện về tác nhân sản xuất hiện nay chỉ mới khoảng sáu tháng tuổi.

Bài nói chuyện bao gồm các phương pháp đánh giá (eval) của đội ngũ họ, khung đánh giá tập trung mà họ xây dựng để tái sử dụng trên các sản phẩm GenAI khác và vòng lặp phản hồi từ các đánh giá trở lại cải tiến sản phẩm. Phiên này đáng để tham dự nếu bạn vẫn đang tìm ra mẫu đánh giá nào phù hợp với chế độ thất bại nào trong hệ thống của chính mình.

Xây dựng nền tảng GenAI tại DoorDash

Siddharth Kodwani, Trưởng nhóm Kỹ thuật, Cơ sở hạ tầng AI tại DoorDash và Swaroop Chitlur, Kỹ sư Cao cấp / Quản lý Kỹ thuật, Nền tảng Học máy tại DoorDash

Câu chuyện về nền tảng của DoorDash bắt đầu với một chế độ thất bại quen thuộc: mọi đội đều bắt đầu xây dựng lại cùng một cơ sở hạ tầng LLM.

Logic thử lại. Cơ chế dự phòng. Theo dõi chi phí. Phiên bản nhắc lệnh (prompt). Xử lý lô. Không cái nào là sản phẩm, nhưng tất cả đều cần thiết.

Bài nói chuyện này khám phá cách DoorDash hợp nhất công việc đó thành các thành phần nền tảng chia sẻ, bao gồm Cổng LLM, Nền tảng Suy luận Lô và Cổng Tác nhân. Câu hỏi thú vị không chỉ là cách xây dựng các hệ thống đó, mà là khi nào cơ sở hạ tầng chia sẻ giúp ích và khi nào nó trở thành một lớp chi phí thêm.

Từ Prompt đến Sản xuất: Kỹ thuật hóa SDLC tự chủ quy mô lớn

Andrew Swerdlow, Giám đốc Phần mềm Cao cấp tại Roblox

Nhiều mã được tạo ra hơn không tự động đồng nghĩa với việc giao phần mềm nhanh hơn.

Đó là vấn đề mà phiên thảo luận này giải quyết. Các công cụ lập trình AI có thể tăng đầu ra, nhưng phần mềm sản xuất vẫn phải được xem xét, chuyển đổi, bảo trì, kiểm tra và phát hành an toàn. Cách tiếp cận của Roblox là coi chính SDLC (Vòng đời phát triển phần mềm) là hệ thống cần thiết kế lại, với các tác nhân tự chủ xử lý việc chuyển đổi và bảo trì cơ sở mã.

Phiên thảo luận giới thiệu Căn chỉnh Mẫu (Exemplar Alignment), một cách tiếp cận để định vị các tác nhân dựa trên phán đoán kỹ thuật của chuyên gia. Câu hỏi khó hơn là câu hỏi mà nhiều đội sẽ sớm phải đối mặt: làm thế nào để đo lường chất lượng khi một tác nhân tạo ra mã, nhưng con người vẫn sở hữu kết quả sản xuất?

QCon AI Boston 2026 diễn ra từ ngày 1 đến 2 tháng 6 tại Đại học Boston, George Sherman Union. Lịch trình đầy đủ và đăng ký có sẵn tại boston.qcon.ai.

Chia sẻ:FacebookX
Nội dung tổng hợp bằng AI, mang tính tham khảo. Xem bài gốc ↗