3 Kỹ năng Claude Cần Thiết cho Nhà Khoa học Dữ liệu vào Năm 2026
Công cụ AI đang thay đổi nhanh chóng ngành khoa học dữ liệu. Bài viết này sẽ giới thiệu ba kỹ năng quan trọng về Claude giúp các chuyên gia tối ưu hóa quy trình làm việc, từ tạo dashboard đến gỡ lỗi code.

3 Kỹ năng Claude Cần Thiết cho Nhà Khoa học Dữ liệu vào Năm 2026
Khi tôi mới bắt đầu sự nghiệp với tư cách là một Nhà khoa học dữ liệu (Data Scientist) vào năm 2022, mọi thứ diễn ra hoàn toàn khác biệt. Những người mới vào nghề hiện nay khó có thể tưởng tượng được thời điểm đó tôi đã dành hàng giờ để làm những việc gì.
Tôi từng tốn rất nhiều thời gian để viết code Python và SQL từ đầu, từng dòng một; ghi nhớ các thư viện cần nhập và các chức năng của chúng; gỡ lỗi các lỗi code; viết tài liệu cho mã nguồn; và xây dựng các bảng điều khiển (dashboard) để phân tích các tập dữ liệu lớn.
Chỉ trong năm qua, khi các công cụ AI ngày càng trở nên tiên tiến hơn, công việc của tôi đã thay đổi. Tôi bớt đi vai trò như một "cỗ máy viết code" và trở nên giống như một nhà chiến lược hơn. Đó là người hiểu rõ dữ liệu trong tổ chức và biết cách trình bày cũng như rút ra những thông tin chi tiết từ nó một cách tốt nhất.
Claude đang thay đổi mọi thứ nhanh hơn cả tốc độ chúng ta tưởng tượng. Tôi sẽ không nói dối, điều này thực sự đáng sợ một chút. Tuy nhiên, có những cách mà các nhà khoa học dữ liệu có thể làm chủ công cụ này, tiếp tục dẫn đầu cuộc chơi.
Dưới đây là 3 kỹ năng QUAN TRỌNG mà mọi nhà khoa học dữ liệu nên làm chủ ngay bây giờ:
1. Tạo Dashboard với Claude
Dashboard mẫu được tạo bởi Claude
Trước đây, tôi từng mất cả ngày để xây dựng một dashboard trên Tableau cho khách hàng chỉ để khám phá vài câu hỏi về một tập dữ liệu lớn có thể sẽ không bao giờ được nhìn lại sau vài tháng.
Giờ đây, Claude có thể tạo ra một dashboard tương tác hoàn chỉnh và hoạt động tốt chỉ trong vài phút, bao gồm đầy đủ:
- Các thẻ chỉ số KPI
- Biểu đồ đường
- Biểu đồ cột
- Các nút khoan sâu (drill-down)
- Các tab điều hướng
- Và nhiều hơn nữa.
Hãy xem xét một ví dụ đơn giản sử dụng tập dữ liệu tiêu thụ năng lượng hàng giờ của AEP. Bạn có thể yêu cầu Claude tạo một dashboard HTML tương tác bao gồm các thẻ KPI về mức tải trung bình, đỉnh, thấp nhất và so sánh mùa hè/mùa đông, cùng với các biểu đồ phân tích theo giờ và tháng.
Kết quả là một dashboard trực quan cho phép chúng ta thấy ngay những thông tin chi tiết mà không thể có được từ file CSV thô:
- Tiêu thụ điện năng vào ngày thường tăng đột biến vào khoảng 5-6 giờ chiều, trong khi cuối tuần đỉnh điểm sớm hơn (khoảng 2 giờ chiều) và ở mức thấp hơn.
- Tiêu thụ trong tháng 7 và 8 cao hơn đáng kể so với các tháng mùa xuân.
- Tải điện vào thứ Bảy và Chủ Nhật luôn thấp hơn khoảng 10% so với ngày thường.
Loại dashboard này rất lý tưởng cho việc Khám phá Dữ liệu Khai thác (EDA) cũng như tạo ra các báo cáo một lần cho các bên liên quan.
2. Sử dụng Claude Cowork để Ưu tiên Jira và Nhiệm vụ
Môi trường làm việc hiện đại với sự hỗ trợ của AI
Đây là cách một buổi sáng thứ Hai điển hình của tôi trước đây: mở Jira, click qua 20 vé đang mở, cố gắng nhớ ngữ cảnh của từng cái, xem xét cái gì đang bị chặn bởi cái gì, và viết một danh sách ưu tiên thô sơ cho tuần.
Claude Cowork khác với Claude Chat ở chỗ nó thực sự kết nối với máy tính để bàn của bạn và có thể đọc/ghi file. Nó có thể kết nối với Jira (hoặc các nền tảng Scrum/Agile khác) và tóm tắt các ưu tiên của bạn trong tuần.
Ví dụ, bạn có thể yêu cầu: "Kéo tất cả các vé đang mở của tôi từ sprint hiện tại. Với mỗi vé, hãy cung cấp cho tôi: ID vé, tóm tắt một câu về những gì cần xảy ra, trạng thái hiện tại và bất kỳ trở ngại nào. Xếp hạng chúng theo mức độ ưu tiên và cho tôi biết tôi nên giải quyết cái nào trước hôm nay."
Dưới đây là một số cách sử dụng khác của Cowork:
- Viết vé vào Jira: Dựa trên ghi chú cuộc họp, tạo các vé Jira cho từng hạng mục hành động, đặt tiêu đề rõ ràng, mô tả và mức độ ưu tiên.
- Chuẩn bị cho cuộc họp với các bên liên quan: Đọc các bình luận 3 tuần qua trên các vé được gắn thẻ 'triển khai mô hình' và viết bản tóm tắt trạng thái.
- Soạn thảo tài liệu từ đầu: Mở file code trong thư mục dự án và viết phần README giải thích pipeline đó làm gì.
- Báo cáo cuối sprint: Viết bản tóm tắt sprint cho quản lý dựa trên các vé đã đóng.
Đây là một công cụ tiết kiệm thời gian khổng lồ và giúp bạn tổ chức công việc tốt hơn.
3. Gỡ lỗi với Claude Code
Giao diện dòng lệnh và code
Claude Code là công cụ dòng lệnh chạy trong terminal của bạn với quyền truy cập đầy đủ vào cơ sở mã (codebase). Nó có thể đọc file trên toàn dự án, chạy lệnh, thực thi kiểm thử và thực hiện thay đổi trên nhiều file.
Đối với các nhà khoa học dữ liệu, ứng dụng hữu ích nhất ngay lập tức là gỡ lỗi các pipeline (data pipelines).
Hãy xem xét một tình huống thực tế với dbt. Khi chạy mô hình, bạn có thể gặp lỗi như "column does not exist". Vấn đề với các mô hình dbt là lỗi cột trong một mô hình hạ nguồn không cho bạn biết cột đó thực sự bị lỗi ở đâu. Nó có thể đã bị đổi tên trong nguồn thô, trong mô hình staging, hoặc ở lớp tổng hợp trung gian.
Để tìm nguyên nhân gốc rễ thủ công, bạn sẽ phải mở từng file trong chuỗi phụ thuộc, theo dõi tên cột qua mọi phép biến đổi. Với một dự án có hàng chục mô hình, việc này có thể mất hơn một giờ.
Thay vào đó, tôi đã giao nó cho Claude Code: "Mô hình dbt fct_energy_forecast của tôi đang bị lỗi với 'column meter_reading_mw does not exist'. Hãy tìm nơi cột này được định nghĩa ở thượng nguồn, truy xuất tất cả các mô hình phụ thuộc và file nguồn, tìm ra điều gì đã xảy ra và sửa chữa nó."
Claude đã đọc mọi file trong chuỗi phụ thuộc và quay lại sau khoảng 40 giây với chẩn đoán. Sau đó, nó áp dụng bản sửa lỗi trên tất cả các dòng, chạy lại mô hình và xác nhận nó đã vượt qua.
Kết luận
Khi các công cụ phát triển, vai trò của chúng ta cũng sẽ thay đổi theo. Claude đang thay đổi loại công việc mà các nhà khoa học dữ liệu sẽ phải làm. Thay vì dành 8 giờ mỗi ngày để gỡ lỗi các lỗi dbt và Python khác nhau, những lỗi đó sẽ được giải quyết trong 2 phút, cho phép chúng ta có nhiều thời gian hơn để đi sâu vào dữ liệu và đặt ra những câu hỏi quan trọng hơn.
Là những nhà khoa học dữ liệu vào năm 2026, điều quan trọng là chúng ta phải liên tục phát triển bộ kỹ năng của mình và cập nhật kiến thức. Tuy nhiên, cũng cần lưu ý rằng mặc dù Claude có nhiều khả năng, nó vẫn là AI và có thể (và thường xuyên) mắc sai lầm. Các nhà khoa học dữ liệu làm chủ Claude vẫn sẽ cần thiết để xác thực dữ liệu, cải thiện các câu lệnh (prompts) và quy trình, cũng như sửa chữa Claude khi nó sai.
Bài viết liên quan

Phần mềm
Plugin Checkmarx Jenkins bị xâm phạm trong cuộc tấn công chuỗi cung ứng
11 tháng 5, 2026

Phần mềm
Google khoe chiến tích "tokenmaxxing" và tung ra các tác nhân AI mới tại I/O 2026
19 tháng 5, 2026

Phần mềm
Google tung ra Antigravity 2.0: Ứng dụng lập trình thế hệ mới với công cụ CLI và gói đăng ký AI Ultra
19 tháng 5, 2026
