Sauce Labs tung ra tác nhân AI tự động hóa tạo kiểm thử, giải quyết nút thắt tốc độ trong DevOps

Sauce Labs đã công bố phiên bản chính thức của Sauce AI for Test Authoring, một tác nhân AI được thiết kế để chuyển đổi ý định kinh doanh thành các bộ kiểm thử có thể thực thi, đánh dấu sự chuyển dịch sang mô hình "Kiểm thử dựa trên ý định". Nền tảng này nhằm giải quyết vấn đề tốn kém tài nguyên trong phát triển phần mềm bằng cách cho phép các nhóm mô tả hành vi mong muốn bằng ngôn ngữ tự nhiên để tự động tạo ra các bài kiểm thử tự cải thiện.

Sauce Labs đã công bố khả năng sử dụng rộng rãi (GA) cho Sauce AI for Test Authoring, một tác nhân AI được thiết kế để chuyển đổi ý định kinh doanh trực tiếp thành các bộ kiểm thử có thể thực thi, đánh dấu bước chuyển dịch sang những gì công ty gọi là "Kiểm thử dựa trên ý định" (Intent-Driven Testing). Nền tảng này nhằm giải quyết một trong những khía cạnh tốn kém nhiều tài nguyên nhất trong phát triển phần mềm — việc tạo kiểm thử — bằng cách cho phép các nhóm mô tả hành vi mong muốn bằng ngôn ngữ tự nhiên và tự động tạo ra các bài kiểm thử tự cải thiện, không phụ thuộc vào khung (framework) cụ thể, có thể chạy trên môi trường đám mây và CI/CD.

Giải quyết nút thắt trong DevOps hiện đại

Sự ra mắt này nhằm mục đích giải quyết một nút thắt ngày càng lớn trong DevOps hiện đại. Khi AI tạo sinh (generative AI) tăng tốc độ sản xuất mã nguồn — thường làm tăng tốc độ phát triển lên gấp 10 lần — thì quy trình kiểm thử lại gặp khó khăn trong việc bắt kịp tiến độ này. Theo Sauce Labs, các doanh nghiệp hiện nay chi từ 22% đến 25% ngân sách CNTT cho đảm bảo chất lượng (QA), nhưng các nhà phát triển vẫn dành hơn 30% thời gian để viết và bảo trì các bài kiểm thử.

Đồng thời, độ phủ kiểm thử tự động cho các hành trình người dùng phức tạp thường dậm chân ở mức dưới 35%, trong khi các nhóm dành tới 40% thời gian để sửa chữa các bài kiểm thử mong manh hoặc "flaky" (không ổn định).

Sauce AI for Test Authoring giới thiệu một mô hình mới trong đó ý định kinh doanh thay thế cho việc viết script thủ công. Nền tảng có thể diễn giải luồng công việc của ứng dụng, thông số kỹ thuật sản phẩm hoặc thậm chí là các đầu vào thiết kế từ các công cụ như Figma, từ đó tạo ra các bộ kiểm thử hoàn chỉnh cho môi trường web và di động. Các kỹ sư, quản lý sản phẩm và các bên liên quan không chuyên về kỹ thuật có thể mô tả hành vi mong muốn bằng ngôn ngữ đơn giản, cho phép hệ thống tạo ra các bài kiểm thử có thể thực thi và liên tục tinh chỉnh chúng thông qua các vòng lặp phản hồi.

Dân chủ hóa tự động hóa kiểm thử

Cách tiếp cận này được thiết kế để dân chủ hóa tự động hóa kiểm thử bằng cách loại bỏ rào cản lập trình, cho phép các chuyên gia trong lĩnh vực bên ngoài các vai trò kỹ thuật truyền thống đóng góp trực tiếp vào việc đảm bảo chất lượng. Nó cũng giới thiệu cơ chế học tập liên tục, trong đó các bài kiểm thử phát triển cùng với ứng dụng, giảm thiểu gánh nặng bảo trì và cải thiện độ tin cậy lâu dài.

Các khả năng của nền tảng tập trung vào ba thách thức dai dẳng trong kiểm thử phần mềm: tốc độ, độ phủ và khả năng bảo trì. Sauce Labs khẳng định tốc độ tạo kiểm thử nhanh hơn tới 90%, độ phủ gần như hoàn toàn đối với các hành trình của người dùng và các script kiểm thử ổn định hơn nhiều có thể thích ứng với các thay đổi của ứng dụng. Các tính năng xem xét và chỉnh sửa tích hợp đảm bảo sự giám sát của con người, trong khi vòng lặp học tập tự chủ liên tục cải thiện độ chính xác và tính phù hợp của bài kiểm thử.

Lợi thế từ "Hào dữ liệu"

Một điểm khác biệt chính là những gì Sauce Labs mô tả là "hào dữ liệu" (data moat) — một tập dữ liệu được dẫn xuất từ 8,7 tỷ lần chạy kiểm thử thực tế. Điều này cho phép sự hiểu biết chính xác hơn về hành vi của ứng dụng và phân tích nguyên nhân gốc rễ (root-cause analysis) nhanh hơn so với các mô hình AI chung chung. Công ty báo cáo rằng điều này dẫn đến khả năng chẩn đoán vấn đề nhanh hơn tới 41%, đặc biệt trong các môi trường doanh nghiệp phức tạp.

Sự ra đời của Kiểm thử dựa trên ý định phản ánh sự thay đổi rộng lớn hơn trong kỹ thuật phần mềm, nơi mà xác thực (validation) đang trở thành ràng buộc chính trong phát triển được tăng tốc bởi AI. Khi việc tạo mã nguồn trở nên nhanh hơn và tự động hóa hơn, việc đảm bảo chất lượng, độ tin cậy và tính đáng tin cậy đã nổi lên như một nút thắt mới.

Sauce Labs định vị sản phẩm mới của mình là một sự thay đổi cơ bản trong các thực hành DevOps, chuyển từ kiểm thử dựa trên script thủ công sang các hệ thống chất lượng tự chủ và thích ứng. Bằng cách nhúng AI vào quy trình tạo kiểm thử, nền tảng nhằm mục đích thu hẹp khoảng cách giữa tốc độ phát triển và khả năng xác thực, cho phép các tổ chức mở rộng quy mô cả hai đồng thời.

Nền tảng hiện đã có sẵn cho khách hàng doanh nghiệp và tích hợp với cơ sở hạ tầng đám mây kiểm thử và thiết bị hiện có của Sauce Labs. Những người áp dụng sớm báo cáo những cải thiện đáng kể trong việc tích hợp và năng suất, đặc biệt trong các kịch bản kiểm thử di động vốn truyền thống đòi hỏi thiết lập và chuyên môn sâu rộng.

Phản ứng của ngành và công nghệ tương tự

Các phản ứng ban đầu từ ngành và cộng đồng đối với việc ra mắt Sauce AI for Test Authoring của Sauce Labs phản ánh sự lạc quan thận trọng dựa trên tác động thực tế thay vì sự cường điệu. Các phân tích nhấn mạnh sự thay đổi cốt lõi của nền tảng hướng tới việc tạo kiểm thử dựa trên ngôn ngữ tự nhiên, củng cố phản hồi rằng giá trị lớn nhất ngay lập tức nằm ở việc tăng tốc tạo kiểm thử và giảm sự phụ thuộc vào các kỹ năng tự động hóa chuyên môn.

Tuy nhiên, một số tiếng nói phê phán hơn trong cộng đồng kiểm thử chỉ ra những thách thức lâu dài vẫn chưa được chứng minh ở quy mô lớn, bao gồm việc đạt được độ phủ cao trong các hành trình người dùng phức tạp và giảm thiểu các bài kiểm thử flaky trong môi trường động.

Một trong những công nghệ tương tự gần nhất với công cụ này đến từ các nền tảng như TestMu AI (trước đây là LambdaTest) và mabl, cũng nhấn mạnh việc tạo kiểm thử dựa trên ngôn ngữ tự nhiên và tự động hóa dựa trên tác nhân. Tác nhân KaneAI của TestMu AI cho phép các nhóm tạo và phát triển các trường hợp kiểm thử từ các mục tiêu cấp cao, đồng thời hỗ trợ di chuyển từ các khung hiện có như Selenium hoặc Cypress.

Trong khi đó, mabl định vị mình là một "đồng kỹ thuật số" (digital teammate), sử dụng AI để tự động xây dựng các bài kiểm thử đầu cuối (end-to-end) từ các câu chuyện người dùng (user stories) và liên tục cập nhật chúng khi ứng dụng thay đổi. Khả năng tự động chữa lỗi (auto-healing) thích ứng của nó có thể điều chỉnh các bước kiểm thử và bộ định vị khi thay đổi giao diện người dùng xảy ra, giảm đáng kể gánh nặng bảo trì.

Các nền tảng khác như Testsigma và Katalon tập trung vào việc tự động xác định các khoảng trống trong độ phủ kiểm thử và tạo ra các kịch bản bổ sung để cải thiện chất lượng, đồng thời hỗ trợ việc tạo kiểm thử bằng tiếng Anh đơn giản để mở rộng khả năng tiếp cận ngoài các kỹ sư. Tương tự, Testim (của Tricentis) nhấn mạnh vào sự ổn định được dẫn hướng bởi AI, sử dụng học máy để khóa vào các yếu tố UI và thích ứng kiểm thử động, giảm tính flaky trong các ứng dụng phức tạp.

Sauce Labs tung ra tác nhân AI tự động hóa tạo kiểm thử, giải quyết nút thắt tốc độ trong DevOps

Giải quyết nút thắt trong DevOps hiện đại

Dân chủ hóa tự động hóa kiểm thử

Lợi thế từ "Hào dữ liệu"

Phản ứng của ngành và công nghệ tương tự

Bài viết liên quan