Sự nghiệp trong lĩnh vực Dữ liệu không nhất thiết phải là một đường thẳng, và điều đó hoàn toàn ổn

Sabrine Bendimerad chia sẻ về tầm quan trọng của sự linh hoạt trong khoa học dữ liệu, những rủi ro khi giao phó tư duy cho các tác nhân AI và sự thay đổi của lộ trình nghề nghiệp trong kỷ nguyên mới.

Trong loạt bài phỏng vấn Author Spotlight, các biên tập viên của Towards Data Science (TDS) có cuộc trò chuyện với các thành viên trong cộng đồng về lộ trình sự nghiệp của họ trong lĩnh vực khoa học dữ liệu và AI. Hôm nay, chúng tôi rất vui mừng được chia sẻ cuộc trò chuyện với Sabrine Bendimerad.

Sabrine là một kỹ sư toán học ứng dụng, người đã dành 10 năm qua làm việc ở vị trí Kỹ sư AI cấp cao (Senior AI Engineer), quản lý các dự án từ những ý tưởng ban đầu cho đến khi đưa vào vận hành sản xuất thực tế.

Hành trình của bà đã trải qua nhiều thế giới rất khác nhau, từ việc phân tích hình ảnh vệ tinh cho các công ty tiện ích lớn ở châu Âu cho đến vai trò hiện tại là nhà nghiên cứu hình ảnh y khoa tại Neurospin. Hiện tại, bà đang làm việc với các hình ảnh não bộ để giúp bệnh nhân đột quỵ phục hồi.

Sabrine cũng là một người cố vấn và người sáng lập Dataiilearn. Bà yêu thích viết không chỉ về mã lệnh (code), mà còn về cách xây dựng một sự nghiệp thực thụ và cách đảm bảo các dự án khoa học dữ liệu thực sự đạt đến giai đoạn cuối cùng để tạo ra tác động thực tế.

Khoa học dữ liệu năm 2026: Liệu có còn đáng để theo đuổi?

Cách đây vài tháng, bà đã đặt ra một câu hỏi cấp bách mà các chuyên gia dữ liệu đang đối mặt hiện nay: "Liệu có còn đáng để theo đuổi không?". Tại sao bà quyết định giải quyết vấn đề này, và quan điểm của bà đã thay đổi như thế nào trong thời gian qua?

Thực tế, bài viết của bà mang tên "Data Science in 2026: Is It Still Worth It?" đã tạo ra một làn sóng tin nhắn lớn trên LinkedIn. Bà dự đoán rằng những người mới vào nghề (juniors) sẽ lo lắng về câu hỏi này, nhưng bà khá ngạc nhiên khi thấy rằng những người có nhiều năm kinh nghiệm cũng đang đặt nghi vấn về tương lai.

Bà chia sẻ: "Tôi đã làm việc trong lĩnh vực AI được 10 năm nay, và đúng là trong những ngày đầu, chỉ cần biết Python và thống kê/toán học là bạn trở thành một 'kỳ lân'. Ngày nay, thị trường đã bão hòa với những nhà khoa học dữ liệu mới, và các công cụ mới dựa trên các tác nhân AI (AI agents) đang tiếp quản các công việc thủ công, đơn giản mà chúng ta từng làm."

Vì vậy, quan điểm của bà vẫn giữ nguyên hoặc thậm chí còn mạnh mẽ hơn ngày nay: AI và khoa học dữ liệu vẫn đáng để theo đuổi, nhưng "nhà khoa học dữ liệu đa năng" (generalist data scientist) đang là một loài đang trên đà tuyệt chủng. Để tồn tại, bạn phải phát triển vượt ra ngoài các mô hình trong notebook. Bạn cần làm chủ việc triển khai (deployment), Mô hình ngôn ngữ lớn (LLMs), RAG, và quan trọng nhất là kiến thức lĩnh vực giúp giải thích dữ liệu. Nếu chúng ta chỉ xây dựng các mô hình cơ bản trong notebook, tất nhiên các tác vụ của chúng ta có thể được thực hiện bởi các tác nhân AI. Các công việc không biến mất; chúng chỉ đang thay đổi. Bạn cần xây dựng các kỹ năng để thích ứng với thị trường mới này.

Hành trình sự nghiệp và bài học thực tế

Bà đã viết khá nhiều về sự nghiệp trong khoa học dữ liệu và AI. Hành trình riêng của bà đã định hình những hiểu biết mà bà chia sẻ với độc giả như thế nào?

Từ đầu, hành trình của bà chưa bao giờ chỉ là về mã lệnh. Bà nhận ra sớm rằng giải quyết các vấn đề thực tế là điều bạn không học được ở trường đại học hay các khóa học bootcamp. Bạn học được nó bằng cách thực chiến trong các nhóm thực tế. Trong những năm làm việc với hình ảnh vệ tinh cho các công ty năng lượng và nước, bà đã học được rằng để tạo ra một giải pháp thực sự, bạn phải tư duy "từ đầu đến cuối" (end-to-end). Nếu một mô hình chỉ nằm trong notebook, nó có tác động bằng không. Đây là lý do bà viết rất nhiều về MLOps — cách quản lý, triển khai và giám sát các mô hình trong môi trường sản xuất.

Chuyển sang lĩnh vực y tế đã thêm một tầng tư duy mới cho bà. Trong ngành tiện ích, nếu bạn mắc sai lầm, bạn phải đối mặt với tổn thất tài chính. Nhưng trong chẩn đoán hình ảnh y khoa, bạn đang nắm giữ sinh mệnh con người. Sự thay đổi này đã dạy bà rằng AI có thể tạo ra mã lệnh, nhưng nó không thể hiểu được tầm nặng của một quyết định con người. Chính xác là vì lý do này mà bà bắt đầu viết về những thứ như RAG, LLMs và tác động của chúng. Đối với bà, đây không chỉ là một chủ đề thị trường; mà là về việc làm thế nào để khiến các công cụ này đủ đáng tin cậy để con người có thể tin tưởng 100%.

Những hiểu biết của bà đến từ sự kết hợp này: Bà có nền tảng công nghiệp về việc xây dựng hệ thống sản xuất, nhưng cũng có nền tảng nghiên cứu nơi phương pháp luận phải hoàn hảo. Bà viết để chia sẻ các kỹ năng kỹ thuật này, nhưng cũng để giúp mọi người điều hướng hành trình của chính họ.

Sự khác biệt giữa người mới bắt đầu hiện nay và 10 năm trước

Những khác biệt đáng chú ý nhất bà quan sát thấy giữa việc bắt đầu ngay bây giờ so với những năm đầu tiên trong lĩnh vực của bà là gì? Sách chơi (playbook) cho các thực tập sinh mới ra trường ngày nay khác biệt như thế nào?

Bà nhận định: "Trò chơi đã được viết lại hoàn toàn. Khi tôi bắt đầu, chúng tôi là những người xây dựng (builders), và chúng tôi dành nhiều tuần chỉ để làm sạch dữ liệu và thiết lập máy chủ. Ngày nay, bạn phải là một Người điều phối AI (AI Orchestrator). Bạn có thể xây dựng một hệ thống trong vài ngày mà trước đây từng mất hàng tháng. Tôi không nói là bây giờ khó hơn, nhưng nó chắc chắn khó nếu bạn cố gắng bắt đầu sự nghiệp bằng các kỹ năng thịnh hành của 10 năm trước."

Những người mới bắt đầu ngày nay có rất nhiều lựa chọn để chuẩn bị cho thị trường. Chúng ta có một kho tàng thông tin trên YouTube và các blog. Thách thức thực sự bây giờ là lọc bỏ những thứ rác rưởi. Những người sống sót là những người theo dõi và hiểu thị trường để thích ứng nhanh chóng. Tất nhiên, bạn cần hiểu mặt lý thuyết của AI, nhưng kỹ năng thực sự ngày nay là sự linh hoạt (flexibility).

Chỉ muốn trở thành chuyên gia trong một công cụ cụ thể không phải là một ý tưởng hay. 10 năm trước, chúng ta nói về việc chuyển từ R sang Python hoặc từ thống kê sang học sâu (deep learning). Ngày nay, chúng ta nói về việc chuyển sang AI tạo sinh (generative AI) và các tác nhân. Nền tảng vẫn giữ nguyên, nhưng bạn cần sự linh hoạt để hiểu nhanh một xu hướng mới, triển khai nó và đáp ứng nhu cầu của các bên liên quan. Sự linh hoạt luôn là "kỹ năng bí mật" của một nhà khoa học dữ liệu, dù là 10 năm trước hay ngày nay.

Tác động của LLMs và AI tác nhân

Trong cuộc sống chuyên nghiệp của bà, sự trỗi dậy của LLMs và AI tác nhân đã có tác động gì? Bà cảm thấy xu hướng này là tích cực, tiêu cực hay something more nuanced (phức tạp hơn)?

Trong công việc hàng ngày, bà sử dụng LLMs như một đồng nghiệp có kinh nghiệm, một người để cùng suy nghĩ (brainstorm) hoặc nhanh chóng tạo mẫu nguyên mẫu và gỡ lỗi (debug) một đoạn script. Với việc triển khai các tác nhân, bà cũng bắt đầu sử dụng "vibe coding" (lập trình dựa trên cảm hứng) và tự động hóa cho các tác vụ cơ bản, nhưng đối với nghiên cứu sâu, bà thận trọng hơn nhiều. Hiện tại, bà đang làm việc với dữ liệu y tế, nơi không có chỗ cho sai sót. Bà có thể sử dụng AI để định hình lại một ý tưởng hoặc làm tinh chỉnh phương pháp luận, nhưng đối với các tác vụ phức tạp, bà phải giữ quyền kiểm soát hoàn toàn mã lệnh của mình.

Bà không phản đối việc sử dụng LLMs và AI tác nhân, nhưng nếu bạn để AI thực hiện tất cả việc suy nghĩ, bạn sẽ mất đi trực giác của mình. Ví dụ, khi làm việc với hình ảnh não bộ, bà phải cực kỳ thủ công với logic cốt lõi vì một LLM không hiểu được bệnh lý mà bạn đang cố gắng dự đoán. Mỗi bộ não là khác nhau; giải phẫu người thay đổi từ đối tượng này sang đối tượng khác. Một tác nhân AI nhìn thấy một khuôn mẫu, nhưng nó không hiểu "tại sao" của căn bệnh.

Bà cũng thấy tác động của các tác nhân AI đối với công việc của các thực tập sinh. Các tác nhân AI là một sự thúc đẩy lớn cho năng suất của họ, nhưng chúng có thể là một thảm họa cho việc học tập của con người. Chúng có thể tạo ra một núi mã lệnh trong một buổi chiều mà trước đây từng mất hàng tháng, và rất khó để làm chủ một chủ đề nếu bạn không bao giờ mắc những sai lầm buộc bạn phải hiểu hệ thống. Chúng ta phải giữ con người ở trung tâm của logic, nếu không chúng ta chỉ đang xây dựng những hộp đen mà chúng ta thực sự không kiểm soát được.

Triển vọng tương lai

Cuối cùng, bà hy vọng sẽ thấy những phát triển nào trong lĩnh vực này trong năm tới hoặc lâu hơn, và những chủ đề nào bà hy vọng sẽ đề cập tiếp trong các bài viết của mình?

Bà chia sẻ: "Tôi thực sự muốn thấy cuộc hội thoại chuyển dịch khỏi việc liên tục đuổi theo các công cụ mới, và hướng tới khoa học tốt hơn và các ứng dụng AI ý nghĩa hơn."

Chúng ta đang ở giai đoạn mà các công cụ, khung công tác và mô hình mới xuất hiện rất nhanh. Mặc dù điều đó thú vị, nhưng tôi nghĩ điều thường bị thiếu là tính minh bạch và sự tập trung sâu hơn vào tác động. Tôi muốn thấy nhiều công việc không chỉ tăng năng suất con người, mà còn đóng góp vào các lĩnh vực như chăm sóc sức khỏe, giáo dục và khả năng tiếp cận một cách hữu hình.

Tất nhiên, LLMs và AI tác nhân sẽ tiếp tục phát triển, và tôi rất quan tâm đến việc khám phá điều đó thực sự có nghĩa là gì trong thực tế. Ngoài sự cường điệu (hype), tôi muốn hiểu rõ hơn và viết về những câu hỏi như:

Các công cụ này có thực sự thay đổi cách chúng ta suy nghĩ, hay chỉ thay đổi tốc độ chúng ta thực thi?
Chúng thực sự cải thiện chất lượng công việc của chúng ta không?
Chúng có tác động gì như thế nào trên các lĩnh vực khác nhau?

Trong các bài viết sắp tới, tôi muốn tập trung nhiều hơn vào những suy ngẫm này, kết hợp các góc độ kỹ thuật với cái nhìn sâu sắc hơn về cách AI đang định hình không chỉ công cụ của chúng ta, mà còn cách làm việc và tư duy của chúng ta.