Anthropic hợp tác với SpaceX, tăng gấp đôi giới hạn cho Claude nhờ siêu trung tâm dữ liệu Colossus

Anthropic chính thức hợp tác với SpaceX để khai thác toàn bộ sức mạnh của trung tâm dữ liệu Colossus, giúp giải quyết tình trạng thiếu hụt tài nguyên cho người dùng Claude. Thỏa thuận này cho phép tăng gấp đôi giới hạn tốc độ trên Claude Code và nâng cao đáng kể giới hạn API cho các mô hình cao cấp. Động thái này nhằm đáp ứng nhu cầu tăng vọt 17 lần về lượng truy cập API trong năm qua.

Anthropic đang hợp tác với SpaceX để giải quyết các ràng buộc về dung lượng đã khiến nhiều khách hàng của Claude bị "kẹt", một động thái có thể xoa dịu sự bất mãn của các nhà phát triển về tính sẵn có và chi phí dịch vụ.

Tại sự kiện dành cho nhà phát triển Code for Claude được phát trực tiếp từ San Francisco, Ami Vora, Giám đốc Sản phẩm của Anthropic, đã công bố việc mở rộng giới hạn tốc độ.

"Kể từ hôm nay, chúng tôi đang tăng giới hạn tốc độ cho các nhà phát triển trên Claude Code và nền tảng Claude," bà Vora cho biết. "Cụ thể hơn, chúng tôi đang tăng gấp đôi giới hạn tốc độ năm giờ của Claude Code cho các gói Pro, Max, Team và doanh nghiệp dựa trên số lượng người dùng. Và chúng tôi đang nâng cao đáng kể giới hạn API cho Claude Opus."

Anthropic cũng chấm dứt việc giảm giới hạn trong giờ cao điểm trên Claude Code đối với tài khoản Pro và Max.

Sức mạnh từ Colossus

Theo bà Vora giải thích, công ty AI này có thể thực hiện điều này nhờ hợp tác với SpaceX giúp mở rộng dung lượng suy luận (inference capacity) có sẵn. Anthropic đã đạt được thỏa thuận để sử dụng "toàn bộ dung lượng của [trung tâm dữ liệu Colossus 1 của SpaceX]".

Theo SpaceX, "Colossus 1 sở hữu hơn 220.000 GPU của Nvidia, bao gồm các triển khai dày đặc của các bộ tăng tốc H100, H200 và thế hệ tiếp theo GB200." Thỏa thuận này bổ sung hơn 300 megawatt dung lượng mới trong vòng một tháng và nối tiếp các sắp xếp tính toán tương tự với Amazon và Google/Broadcom.

Cơn khát sức mạnh xử lý không thể thỏa mãn của công ty thậm chí có thể đưa họ lên vũ trụ. Anthropic cho biết họ "đã bày tỏ sự quan tâm đến việc hợp tác với SpaceX để phát triển nhiều gigawatt dung lượng tính toán AI trên quỹ đạo."

Nhu cầu tăng đột biến

Trong những tháng gần đây, Anthropic đã gặp khó khăn trong việc đáp ứng nhu cầu bất ngờ đối với các dịch vụ Claude — các mô hình của họ đã đủ khả năng để thuyết phục những nhà phát triển hoài nghi và mô hình sử dụng đã thay đổi do sự phổ biến của các tác nhân dài hạn (long-running agents).

"So với cùng kỳ năm ngoái, lượng API đã tăng gần 17 lần trên nền tảng đám mây," bà Vora nói. "Và trên Claude Code, nhà phát triển trung bình hiện dành 20 giờ mỗi tuần để chạy Claude."

Giữa sự phổ biến ngày càng tăng này, Anthropic cũng phải vật lộn với các lỗi ảnh hưởng đến hiệu suất mô hình.

Trong bài thuyết trình của mình, bà Vora đã hạ thấp kỳ vọng bằng cách lưu ý rằng sẽ không có mô hình mới nào được công bố. Thay vào đó, bà chủ trì một bài đánh giá về các tính năng Claude mới và gần đây trong nỗ lực định hình sự cải tiến mô hình theo cấp số nhân.

Số mũ quan trọng ở đây sẽ là hai — việc tăng gấp đôi giới hạn tốc độ năm giờ của Claude. Hiệu suất mô hình, được đo bằng các điểm chuẩn, chỉ mang tính gia tăng. Opus 4.7 chỉ tốt hơn vài phần trăm so với Opus 4.6 trong các phép đo khác nhau, không phải gấp đôi khả năng hay hơn thế nữa.

Điều đó không ngăn bà Vora tuyên bố: "mặc dù các khả năng của mô hình đang được cải thiện theo cấp số nhân, hầu hết các tổ chức vẫn đang áp dụng AI theo đường tuyến tính."

Việc sử dụng từ "cấp số nhân" của bà Vora có thể nhiều hơn là một thiết bị khung chủ đề hơn là một khẳng định theo nghĩa đen về sự tiến bộ, một thiết bị để tạo ra sự tương phản giữa khả năng của Claude và tốc độ áp dụng AI của doanh nghiệp thận trọng hơn. Bà định hình bài đánh giá tính năng sắp tới là cơ hội để khách hàng xem nơi phát triển của Claude đang hướng tới, "Vì vậy, bạn có thể lên kế hoạch cho nó và cùng chúng tôi cưỡi con sóng cấp số nhân này."

Các tính năng mới: Dreaming và Routines

Phần còn lại của bài thuyết trình bao gồm tóm tắt các cải tiến tính năng Claude gần đây. Chúng bao gồm: điều phối đa tác nhân (multi-agent orchestration), kết quả (outcomes) và dreaming — một khả năng xuất hiện trong rò rỉ mã nguồn Claude Code gần đây.

"Với Dreaming," Angela Jiang, người đứng đầu sản phẩm của nền tảng Claude giải thích, "Claude thực sự có thể tự học. Nó có thể thực sự kiểm tra các phiên trước đó, tìm ra các kỹ năng mà nó đã bỏ lỡ, các bài học mà nó nên học được và thực sự áp dụng những điều đó trực tiếp vào bộ nhớ của chính nó."

Boris Cherny, người đứng đầu Claude Code, đã bước lên sân khấu để nhắc nhở mọi người về Routines, một cách để kích hoạt và chạy các công việc Claude cục bộ hoặc trên máy chủ đám mây.

"Routines có thể chạy theo lịch trình, chúng có thể được khởi chạy bởi webhooks, hoặc chúng thậm chí có thể được khởi chạy bởi các cuộc gọi API tùy ý, bạn có thể chạy chúng cục bộ trên máy của mình hoặc trên máy tính đám mây từ xa," ông nói.

Ông Cherny chia sẻ thêm: "đối với tôi cá nhân, rất nhiều mã của tôi hiện nay được viết bởi các routines. Tôi không phải là người viết prompt. Tôi là người tạo ra một routine thực hiện việc viết prompt đó."

Ai mà lại không muốn "cưỡi con sóng cấp số nhân" khi công ty của mình trả tiền cho hóa đơn API?

Anthropic hợp tác với SpaceX, tăng gấp đôi giới hạn cho Claude nhờ siêu trung tâm dữ liệu Colossus

Sức mạnh từ Colossus

Nhu cầu tăng đột biến

Các tính năng mới: Dreaming và Routines

Bài viết liên quan