Danh sách bài viết

Python, Data & Math Foundations

Dành cho người non-tech muốn bước vào AI. Mục tiêu: đọc được code AI, xử lý dữ liệu và hiểu toán nền đủ để hiểu model.

23/05/2026
8-10 tuần đọc
0 lượt xem
Toán nền tảng cho AI Engineer

Module 1: Định hướng & Môi trường

  • Bài 1: AI Engineer thực chiến làm gì? Phân biệt vai trò với Data Scientist, ML Engineer, Data Analyst
  • Bài 2: Lộ trình series Python, Data & Math — học để chuẩn bị cho 5 series sau (ML, DL, LLM, Deployment, Job)
  • Bài 3: Thiết lập Google Colab — môi trường code AI không cần cài đặt
  • Bài 4: Notebook (.ipynb) là gì và quy trình làm việc theo cell

Module 2: Python Cơ bản cho AI

  • Bài 5: Biến và 4 kiểu dữ liệu nguyên thủy: int, float, str, bool
  • Bài 6: Toán tử số học, so sánh và logic
  • Bài 7: Lệnh rẽ nhánh: if / elif / else
  • Bài 8: Vòng lặp for và hàm range
  • Bài 9: Vòng lặp while và break / continue
  • Bài 10: Hàm (Function): def, tham số, return
  • Bài 11: List và các thao tác cơ bản
  • Bài 12: Tuple — list bất biến và unpacking
  • Bài 13: Dictionary — key-value lookup
  • Bài 14: Set và phép toán tập hợp
  • Bài 15: List comprehension — viết list ngắn gọn
  • Bài 16: Xử lý lỗi với try / except / finally
  • Bài 17: Đọc / ghi file text với open và context manager (with)

Module 3: Toán nền tảng cho AI

  • Bài 18: Vector trực quan — danh sách số có hướng, phép cộng vector, phép nhân vô hướng
  • Bài 19: Ma trận và phép nhân ma trận — vì sao quan trọng trong neural network
  • Bài 20: Tensor là gì? Mở rộng từ vector / ma trận lên N chiều
  • Bài 21: Mean, Median, Mode — đo lường xu hướng trung tâm
  • Bài 22: Variance và Standard Deviation — đo lường độ phân tán
  • Bài 23: Phân phối chuẩn (Normal Distribution) — vì sao xuất hiện ở khắp nơi trong AI
  • Bài 24: Xác suất cơ bản và xác suất có điều kiện
  • Bài 25: Đạo hàm (Derivative) trực quan — đo lường tốc độ thay đổi
  • Bài 26: Loss function là gì? Mục tiêu mà model cần tối ưu
  • Bài 27: Gradient Descent — cách AI "học" bằng cách đi xuống dốc

Module 4: NumPy

  • Bài 28: NumPy ndarray — vì sao nhanh hơn list Python
  • Bài 29: Tạo array và indexing
  • Bài 30: Slicing array và boolean indexing
  • Bài 31: Vectorization — phép tính element-wise trên array
  • Bài 32: Shape và reshape array — biến đổi hình dạng dữ liệu
  • Bài 33: Broadcasting — phép tính giữa array khác shape

Module 5: Pandas

  • Bài 34: Series và DataFrame — 2 cấu trúc cốt lõi
  • Bài 35: Đọc CSV / JSON / Excel với Pandas
  • Bài 36: Quan sát nhanh dữ liệu: head, info, describe, dtypes
  • Bài 37: Lọc dữ liệu với boolean mask
  • Bài 38: Chọn dòng / cột với loc và iloc
  • Bài 39: Sắp xếp dữ liệu với sort_values
  • Bài 40: Xử lý missing data (NaN): dropna, fillna, interpolate
  • Bài 41: Groupby và Aggregation — tổng hợp dữ liệu theo nhóm