Khi các nhà thiên văn học dùng AI săn tìm thiên hà: Áp lực lên nguồn cung GPU toàn cầu
NASA và các đài quan sát thiên văn hiện đại đang tạo ra lượng dữ liệu khổng lồ, buộc các nhà khoa học phải chuyển sang sử dụng GPU và trí tuệ nhân tạo để xử lý thông tin. Việc áp dụng các mô hình học sâu như Morpheus và công nghệ Transformers giúp phát hiện nhanh chóng các thiên hà, nhưng đồng thời cũng làm gia tăng tình trạng khan hiếm phần cứng trên toàn cầu.

NASA vừa thông báo kế hoạch phóng kính viễn vọng không gian Nancy Grace Roman vào quỹ đạo vào tháng 9 năm 2026, sớm hơn dự kiến 8 tháng. Trong suốt vòng đời hoạt động của mình, kính viễn vọng mới này dự kiến sẽ cung cấp cho các nhà thiên văn học tới 20.000 terabyte dữ liệu.
Con số này cộng hưởng với 57 gigabyte hình ảnh ngoạn mục được truyền xuống mỗi ngày từ Kính viễn vọng Không gian James Webb (bắt đầu hoạt động từ năm 2021), cùng với việc Đài quan sát Vera C. Rubin tại Chile bắt đầu các cuộc khảo sát vào cuối năm nay - nơi dự kiến thu thập 20 terabyte dữ liệu mỗi đêm.
Để so sánh, Kính viễn vọng Hubble - từng là tiêu chuẩn vàng - chỉ cung cấp từ 1 đến 2 gigabyte dữ liệu cảm biến mỗi ngày. Mặc dù đã lâu rồi con người không còn tự kiểm tra từng số liệu đọc được bằng tay, nhưng giống như bất kỳ ai đang phải đối mặt với một núi dữ liệu khổng lồ, các nhà thiên văn học hiện nay đang chuyển sang sử dụng GPU để giải quyết vấn đề của mình.
Brant Robertson, một nhà vật lý thiên văn tại UC Santa Cruz, đã có cơ hội chứng kiến trực tiếp sự thay đổi bước ngoặt này trong khoa học khi hỗ trợ hoặc sử dụng dữ liệu từ các nhiệm vụ không gian. Robertson đã dành 15 năm qua làm việc với Nvidia để áp dụng GPU vào việc giải quyết các bài toán về vũ trụ, trước tiên thông qua các mô phỏng tiên tiến kiểm tra các lý thuyết về vụ nổ siêu tân tinh, và hiện nay là phát triển các công cụ để phân tích dòng dữ liệu khổng lồ từ các đài quan sát mới nhất.
"Đã có sự tiến hóa [từ] việc quan sát một vài vật thể, sang thực hiện phân tích dựa trên CPU trên quy mô lớn của bộ dữ liệu, và sau đó là thực hiện các phiên bản phân tích tăng tốc GPU của những phân tích đó," ông chia sẻ với TechCrunch.
Robertson và cựu sinh viên Ryan Hausen đã phát triển một mô hình học sâu gọi là Morpheus có thể rà soát các bộ dữ liệu lớn để xác định các thiên hà. Phân tích AI sớm của họ trên dữ liệu từ James Webb đã xác định được một số lượng đáng ngạc nhiên về một loại cụ thể của các thiên hà đĩa, thêm một khía cạnh mới vào các lý thuyết về sự phát triển của vũ trụ chúng ta.
Hiện tại, Morpheus cũng đang thay đổi để bắt kịp thời đại: Robertson đang chuyển đổi kiến trúc của nó từ mạng nơ-ron tích chập (CNN) sang Transformers - công nghệ đứng sau sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM). Điều này sẽ giúp mô hình có khả năng phân tích diện tích lớn hơn gấp nhiều lần so với hiện tại, từ đó tăng tốc độ công việc.
Robertson cũng đang làm việc trên các mô hình AI tạo sinh được huấn luyện dựa trên dữ liệu từ kính viễn vọng không gian để cải thiện chất lượng quan sát thu thập bởi các kính viễn vọng mặt đất, vốn bị méo mó bởi khí quyển Trái Đất. Mặc dù công nghệ tên lửa có tiến bộ, nhưng việc đưa một chiếc gương đường kính 8 mét lên quỹ đạo vẫn rất khó khăn, vì vậy việc sử dụng phần mềm để cải thiện quan sát của Rubin là giải pháp tốt nhất tiếp theo.
Tuy nhiên, ông vẫn cảm nhận được áp lực từ nhu cầu toàn cầu về việc tiếp cận GPU. Robertson đã sử dụng Quỹ Khoa học Quốc gia (NSF) để xây dựng một cụm GPU tại UC Santa Cruz, nhưng nó đang trở nên lỗi thời ngay khi càng nhiều nhà nghiên cứu muốn áp dụng các kỹ thuật tính toán cường độ cao vào công việc của mình. Chính quyền Trump từng đề xuất cắt giảm ngân sách của NSF xuống 50% trong yêu cầu ngân sách hiện tại.
"Mọi người muốn thực hiện các phân tích AI, ML này, và GPU thực sự là cách để làm điều đó," Robertson nói. "Bạn phải có tinh thần doanh nhân... đặc biệt là khi bạn đang làm việc ở ranh giới của công nghệ. Các trường đại học rất ngại rủi ro vì họ chỉ có nguồn lực hạn hẹp, vì vậy bạn phải đi ra ngoài và chỉ cho họ thấy rằng, 'nhìn này, đây là nơi chúng ta đang hướng tới trong lĩnh vực này'."

