Cẩm nang trở thành Kỹ sư AI: Kỹ năng, Dự án và Mức lương khủng
Trở thành kỹ sư AI không phải là điều có thể hoàn thành chỉ trong vài tháng. Bài viết này cung cấp lộ trình thực tế, từ nền tảng kỹ năng phần mềm, kiến thức AI/ML, cho đến việc xây dựng dự án và tìm kiếm việc làm. Với mức lương hấp dẫn, đây là con đường đầy thách thức nhưng đáng giá cho những ai đam mê công nghệ.

Cảnh báo: Đó sẽ mất lâu hơn 3 tháng
Vai trò kỹ sư AI đang trở nên "nóng" nhất trong ngành công nghệ hiện nay, và nhiều người đang khao khát tìm kiếm cơ hội này. Tôi thấy rất nhiều bài viết online quảng cáo rằng bạn có thể trở thành kỹ sư AI chỉ trong vài tháng. Hãy để tôi làm rõ: bất kỳ ai nói rằng bạn có thể trở thành kỹ sư AI trong sáu tháng là đang bán giấc mơ cho bạn.
Thực tế là quá trình này sẽ mất lâu hơn, nhưng điều đó không có nghĩa là bạn không thể rút ngắn thời gian. Nếu bạn mới đến đây, tôi là Egor. Tôi làm việc như một kỹ sư Machine Learning và là huấn luyện viên sự nghiệp cho những người muốn bước vào lĩnh vực dữ liệu, AI và Machine Learning. Tôi đã chứng kiến trực tiếp những điều gì hiệu quả và những điều gì chỉ lãng phí thời gian. Hãy đi vào chi tiết!
Kỹ sư AI là gì?
Để làm rõ chính xác kỹ sư AI là gì, vì có rất nhiều sự nhầm lẫn trực tuyến. Tôi có một bài viết riêng giải thích sự khác biệt chính, nhưng tóm tắt lại, một kỹ sư AI là một kỹ sư phần mềm chuyên về việc sử dụng và tích hợp các mô hình nền tảng GenAI (như Claude, GPT, BERT và các mô hình khác).
Họ không "xây dựng" các mô hình này từ đầu như một nhà khoa học dữ liệu hay kỹ sư Machine Learning; thay vào đó, họ sử dụng chúng để phục vụ một mục đích cụ thể. Ví dụ, họ có thể nhúng một chatbot trên website mua sắm để giúp khách hàng tìm thấy những gì họ cần nhanh hơn, hoặc thêm một trợ lý lập trình trong IDE như Cursor. Vì kỹ sư AI là những kỹ sư phần mềm chuyên biệt, họ cần nắm vững các thực hành cơ bản của kỹ thuật phần mềm và có kiến thức sâu về hệ thống AI. Kỹ năng này hiếm có nhưng đang có nhu cầu cao do cơn sốt AI. Do đó, mức lương của kỹ sư AI rất cao; theo levels.fyi, nhiều công ty trả khoảng 200.000 - 300.000 USD.
Bước 1: Điểm đến (Entry Point)
Một thực tế đáng buồn là cực kỳ khó để bước vào kỹ thuật AI với kinh nghiệm bằng không trước đây. Lý do là nghề này đòi hỏi sự am hiểu rộng về dữ liệu, Machine Learning, kỹ thuật phần mềm và AI. Do đó, bạn sẽ cần trở thành một nhà khoa học dữ liệu hoặc kỹ sư phần mềm trong ít nhất một năm trước khi nghĩ đến việc chuyển hướng sang kỹ sư AI.
Bạn nên trở thành nhà khoa học dữ liệu hay kỹ sư phần mềm là do bạn và bối cảnh của bạn. Tuy nhiên, tôi cá nhân khuyên nên bắt đầu với kỹ sư phần mềm, vì nó có liên quan nhiều hơn với vai trò kỹ sư AI. Bạn không cần phải tin vào tôi; Greg Brockman (CTO của OpenAI) cũng đồng ý rằng nên là kỹ sư phần mềm trước, sau đó cải thiện kiến thức AI/ML của mình.
Là một kỹ sư phần mềm, bạn nên nỗ lực học các công cụ và công nghệ cần thiết để trở thành một kỹ sư AI, bao gồm:
- Python: Toàn bộ hệ sinh thái AI/ML được xây dựng bằng Python, vì vậy bạn cần viết được mã sản xuất tốt bằng ngôn ngữ này.
- SQL: AI xoay quanh dữ liệu, và SQL là ngôn ngữ của dữ liệu.
- Công cụ phát triển phần mềm: Cần biết git cho kiểm soát phiên bản, cơ bản zsh/bash và hiểu cách tạo và sử dụng API.
- Kiến trúc hệ thống: Hệ thống AI bạn cuối cùng sẽ xây dựng cần mở rộng, và bạn sẽ triển khai nó trên các nền tảng đám mây như AWS, Azure, GCP bằng các công cụ như Docker và Kubernetes.
Hình minh họa về kiến trúc hệ thống AI và tích hợp các mô hình ngôn ngữ lớn (LLM)
Tài nguyên:
- Khóa học Python của W3Schools (miễn phí) – Tài nguyên miễn phí tuyệt vời.
- Giới thiệu về Khoa học máy tính CS50 của Harvard – Có lẽ là khóa học giới thiệu tốt nhất về khoa học máy tính và kỹ thuật phần mềm!
Thời gian: Thời gian phụ thuộc vào việc bạn mất bao lâu để tìm được việc làm kỹ sư phần mềm hoặc nhà khoa học dữ liệu. Thực tế, nếu bạn có nền tảng STEM và kiến thức vững chắc, và thực sự nỗ lực, bạn có thể xin việc trong các vị trí này trong khoảng 6 tháng. Bạn nên ở trong vai trò này khoảng một năm trước khi cố gắng chuyển đổi sang kỹ sư AI để đảm bảo bạn đã nắm vững các kiến thức nền tảng.
Bước 2: Cơ bản AI/ML
Song song với công việc toàn thời gian của bạn như một kỹ sư phần mềm, bạn cần nâng cao kỹ năng về các kiến thức cơ bản của AI/ML để đảm bảo tiến trình nhanh chóng.
Bạn chắc chắn không cần mức hiểu biết bằng Tiến sĩ Toán, vì bạn sẽ không xây dựng các mô hình này từ đầu, nhưng nó sẽ cung cấp chi tiết nền tảng để đi sâu vào các chủ đề nâng cao hơn sau này.
Điều bạn nên biết bao gồm:
- Toán cơ bản: Tổng quan vững chắc về thống kê, xác suất, đại số tuyến tính và giải tích sẽ giúp bạn hiểu những gì đang diễn ra dưới vỏ bọc.
- Học có giám sát: Biết cách các thuật toán cơ bản như hồi quy tuyến tính, cây quyết định và máy hỗ trợ vector (SVM) hoạt động.
- Học không giám sát: Biết cách các thuật toán cơ bản như K-Means và K-Nearest-Neighbour hoạt động.
- Mạng nơ-ron: Đây là xương sống của các LLM, và việc có sự hiểu biết tốt về các chủ đề như lan truyền ngược, gradient biến mất và hàm kích hoạt sẽ cho phép bạn gỡ lỗi các mô hình AI nhanh hơn trong tương lai.
- Cơ bản về LLM: Mặc dù bạn sẽ không xây dựng LLM từ đầu, bạn sẽ làm việc với chúng mỗi ngày, vì vậy tốt hơn là nên có một chút kiến thức về cách chúng hoạt động. Bạn nên học về các lĩnh vực như chuyển đổi (transformers), mã hóa tự động (autoencoders), mã hóa token và nhúng.
Tài nguyên:
- Mathematics for Machine Learning (liên kết đối tác) – Cuốn sách toàn diện tốt nhất, nhưng khá nặng.
- Tự học Machine Learning với Scikit-Learn, Keras và TensorFlow (liên kết đối tác) – Nếu tôi phải đưa cho bạn một cuốn sách để học Machine Learning, đó sẽ là cuốn này!
- Neural Networks: Zero to Hero – Bắt đầu khá chậm, xây dựng một mạng nơ-ron từ đầu. Tuy nhiên, trong video cuối cùng, anh ấy sẽ cho bạn thấy cách xây dựng Generative Pre-trained Transformers (GPT) của riêng bạn!
Thời gian: Việc học các kiến thức cơ bản phụ thuộc vào chính xác bạn học bao lâu trong khi làm việc như một nhà khoa học dữ liệu/kỹ sư phần mềm. Lời khuyên là tích hợp các khái niệm này vào công việc hàng ngày của bạn càng nhiều càng tốt. Nếu tôi đang học tất cả những điều này ngoài giờ làm việc, tôi dự kiến sẽ mất 3-6 tháng nếu bạn nỗ lực.
Bước 3: Kiến thức Kỹ sư AI
Đến thời điểm này, đã đến lúc đi sâu vào các khái niệm và ý tưởng cụ thể mà bạn sẽ sử dụng như một kỹ sư AI trong thế giới thực.
Lĩnh vực này đang phát triển rất nhanh, và mỗi tháng đều có một cái mới để học. Tôi sẽ liệt kê các nền tảng vĩnh cửu ở đây vì chúng là quan trọng nhất.
- AI APIs: Các dịch vụ như API của OpenAI cho phép bạn tích hợp các mô hình mạnh mẽ mà không cần xây dựng chúng. Đây là cách nhanh nhất để bắt đầu xây dựng các ứng dụng có khả năng AI.
- Prompt Engineering: Học cách giao tiếp hiệu quả với các mô hình AI là một kỹ năng quan trọng. Prompt được thiết kế tốt có thể cải thiện đáng kể đầu ra của mô hình và là điều kiện cần thiết để có được kết quả nhất quán.
- Tạo tăng cường truy xuất (RAG): Hiểu cách kết nối với LLM đến các cơ sở dữ liệu bên ngoài như Pinecone và sử dụng thông tin liên quan để cải thiện độ chính xác của câu trả lời của mô hình AI.
- Mô hình giao thức ngữ cảnh (MCP): Cách tiêu chuẩn hóa để kết nối các mô hình AI với các ứng dụng bên ngoài như tệp, máy chủ và các ứng dụng khác.
- LangChain: Đây là gói tốt nhất để làm việc với các mô hình AI trong Python. Nó cung cấp kiến trúc bạn cần để xây dựng và kết nối LLM một cách liền mạch.
- Fine-Tuning: Hiểu cách cải thiện hiệu suất của mô hình AI bằng cách đào tạo nó trên dữ liệu cụ thể để nó tốt hơn trong việc phản hồi và đưa ra đầu ra cho một trường hợp sử dụng nhất định.
Tài nguyên:
- Tự học các Mô hình Ngôn ngữ Lớn (Hands-On Large Language Models) – Chưa có nhiều giáo trình về LLM, vì chúng chỉ trở nên phổ biến trong những năm gần đây. Tuy nhiên, tôi đã nghe rất nhiều điều tốt về cuốn này.
- AI Engineering (liên kết đối tác) – Cuốn sách này đang rất phổ biến. Nó được viết bởi Chip Huyen, người có thể được coi là chuyên gia hàng đầu về các hệ thống ML/AI trong sản xuất.
Thời gian: Việc học các khái niệm này sẽ mất ít thời gian hơn việc học các kiến thức cơ bản AI/ML, vì có ít tài liệu hơn. Tôi dự kiến sẽ mất khoảng 2-3 tháng để học tất cả mọi thứ ở mức độ tốt.
Bước 4: Dự án
Có nhiều sự nhầm lẫn về các dự án bạn nên xây dựng để xin việc kỹ sư AI.
Đơn giản hóa, các dự án tốt nhất là những dự án có động lực nội tại cho bạn và cũng có lợi cho một loại người dùng hoặc khách hàng nhất định.
Các bước cấp cao bao gồm:
- Ý tưởng: Brainstorm ý tưởng và chủ đề cá nhân cho bạn và vấn đề bạn muốn giải quyết. Điều này nên đến từ suy nghĩ và nghiên cứu của riêng bạn; đừng tìm online hoặc hỏi những người như tôi về ý tưởng dự án. Bất cứ thứ gì tôi đưa cho bạn sẽ ngay lập tức trở thành một dự án tồi cho bạn.
- Dữ liệu: Tìm dữ liệu mới và thú vị bằng cách sử dụng các API công khai, các trang web chính phủ, web scraping, v.v. Bạn muốn tái tạo dữ liệu lộn xộn mà bạn sẽ gặp phải trong thế giới thực.
- Triển khai: Bạn cần thể hiện khả năng triển khai hệ thống AI end-to-end. Điều này bao gồm lưu trữ dữ liệu, làm sạch dữ liệu, kết nối mô hình sau đó là một số tích hợp ở phía trước qua API hoặc thậm chí là một ứng dụng web. Bạn cần khớp với công việc bạn sẽ làm như một kỹ sư AI toàn thời gian càng nhiều càng tốt.
- Tài liệu: Không ai sẽ biết về dự án của bạn nếu bạn không cho người khác biết. Đăng một bài trên LinkedIn, viết một bài blog và thêm nó vào hồ sơ của bạn. Đảm bảo dự án của bạn có README rõ ràng, có tổ chức tốt trên GitHub để mọi người có thể kiểm tra nó. Chia sẻ công việc của bạn càng nhiều càng tốt, vì nó sẽ tăng cơ hội được những nhà tuyển dụng tiềm năng nhìn thấy.
Thời gian: Việc tạo ra các dự án tốt và xây dựng một bộ portfolio vững chắc sẽ mất thời gian. Lý tưởng nhất, bạn nên xây dựng hai dự án hạng nhất sẽ mất tổng cộng khoảng 3 tháng. Điều này giả định bạn có thể dành 1 giờ mỗi ngày để xây dựng chúng.
Bước 5: Tìm việc làm
Điều này có thể là một bài viết riêng, nhưng hãy cho tôi biết tóm tắt 80/20 những gì bạn nên làm:
Hồ sơ (Resume): Để viết một bản CV xuất sắc, hãy đảm bảo mọi thứ đều liên quan đến kỹ sư AI:
- Đặt kỹ năng kỹ thuật của bạn ngay ở trên cùng với các công cụ và công nghệ liên quan cho các vị trí kỹ sư AI.
- Làm cho dự án của bạn hiển thị rõ ràng với các chỉ số, số liệu, và đặc biệt là tác động tài chính.
- Giữ đơn giản: màu sắc trung tính, cột đơn, phông chữ dễ đọc và chỉ một trang.
- Liệt kê kinh nghiệm liên quan của bạn dưới dạng kỹ sư phần mềm hoặc nhà khoa học dữ liệu.
LinkedIn: Làm cho hồ sơ LinkedIn của bạn rõ ràng rằng bạn đang ứng tuyển cho các vị trí kỹ sư AI:
- Tiêu đề của bạn phải chứa "Kỹ sư AI", xin lỗi nhưng không nên dùng "aspiring" (nếu muốn). Ví dụ, ai sẽ thuê một "nha sĩ" "mong muốn"?
- Bao gồm từ khóa trong các phần "Giới thiệu" và "Kinh nghiệm", nhưng thêm chúng một cách tự nhiên và không viết các đoạn văn dài.
- Làm cho hồ sơ có thẩm mỹ với một bức ảnh rõ ràng và một băng rôn đẹp. Điều này có tác động lớn hơn bạn nghĩ.
Giới thiệu và Networking: Hầu hết mọi người nghĩ họ cần xây dựng hàng loạt dự án và lấy vô số khóa học để nổi bật và tìm việc. Đó là sự lãng phí hoàn toàn thời gian.
Giới thiệu (Referrals) là vé vàng cho bất kỳ công việc công nghệ nào. Theo một nghiên cứu, giới thiệu chiếm 7% các đơn ứng tuyển nhưng 40% tất cả các tuyển dụng. Nếu được giới thiệu, khả năng nhận được công việc mơ ước của bạn là gần 6 lần cao hơn.
Cách bạn nhận được giới thiệu thực sự khá đơn giản, và nó chỉ đòi hỏi sự tự tin ở phía bạn.
- Tìm các công ty đang tuyển dụng kỹ sư AI hoặc các công ty bạn muốn làm việc.
- Duyệt nhân viên của họ trên LinkedIn và tìm người giống với bạn. Đây có thể là người cùng trường đại học và bối cảnh, lý tưởng nhất là một kỹ sư AI.
- Kết nối và gửi tin nhắn chứa điều gì đó bạn thích về hồ sơ, hành trình của họ hoặc bất cứ điều gì cá nhân. Tuyệt đối không xin giới thiệu trong tin nhắn đầu tiên.
- Chat với họ và hỏi họ về công việc, dự án của họ và bất cứ điều gì thú vị họ đang làm.
- Sau vài tin nhắn, đó là lúc bạn xin giới thiệu hoặc bất kỳ phản hồi nào về CV của bạn.
Quá trình rất đơn giản, vấn đề là con người quá sợ hãi để làm điều đó.
Tuy nhiên, tôi chưa bao giờ có trải nghiệm xấu, vì bạn luôn đi trước bằng lời khen hoặc một lời mở đầu về họ. Mọi người thích nói về bản thân, và điều bạn cần làm là xuất hiện thân thiện và cho thấy bạn quan tâm đến họ.
Thời gian: Việc tìm việc có thể rất khác nhau và nó cũng phụ thuộc vào may mắn đôi khi. Tuy nhiên, bằng cách thực sự theo đuổi giới thiệu và tránh xa sự xao nhãng từ các dự án và khóa học, điều này nên mất khoảng 6 tháng.
Vì vậy, để trở thành một kỹ sư AI, nó sẽ mất cho bạn, lạc quan nhất là khoảng 2 năm, nhưng bạn cũng cần tìm được việc làm như một kỹ sư phần mềm hoặc nhà khoa học dữ liệu trước.
Điều này có vẻ là một thời gian dài, nhưng các vị trí này là rất có kỹ năng và trả lương phi thường. Bạn không thể mong đợi làm vài khóa học và đi thẳng vào chúng.
Nếu sau khi đọc bài viết này, bạn thực sự muốn trở thành một kỹ sư AI, đó là tuyệt vời! Tuy nhiên, như tôi vừa đề cập, bạn cần trở thành một nhà khoa học dữ liệu trước. May mắn thay, trong một trong những bài viết trước của tôi, tôi đã viết chính xác các bước tôi sẽ theo đuổi nếu tôi trở thành nhà khoa học dữ liệu lần nữa. Tôi sẽ gặp bạn ở đó!
Một điều nữa! Tham gia vào bản tin miễn phí của tôi nơi tôi chia sẻ hàng tuần các mẹo, ý kiến và lời khuyên từ kinh nghiệm của tôi như một nhà khoa học dữ liệu thực hành và kỹ sư Machine Learning. Hơn nữa, với tư cách là người đăng ký, bạn sẽ nhận được Mẫu CV miễn phí của tôi!



