Blog Series Roadmap

Danh sách bài viết

Deep Learning

Hiểu neural network hoạt động và train được deep learning model cơ bản.

23/05/2026

10-12 tuần đọc

2 lượt xem

Deep Learning cơ bản

Module 1: Nền tảng ANN

Bài 1: Tại sao Deep Learning? Phân biệt với ML cổ điển
Bài 2: Perceptron — đơn vị tính toán cơ bản nhất
Bài 3: Multi-Layer Perceptron (MLP) — chồng nhiều layer
Bài 4: Forward Propagation — luồng dữ liệu đi qua mạng
Bài 5: Activation function: Sigmoid và vấn đề saturation
Bài 6: Activation function: ReLU và biến thể (LeakyReLU)
Bài 7: Activation function: Tanh
Bài 8: Activation function: Softmax cho multi-class
Bài 9: Loss function cho regression: MSE, MAE
Bài 10: Loss function cho classification: Cross-Entropy
Bài 11: Backpropagation — chain rule và cập nhật trọng số

Module 2: PyTorch

Bài 12: PyTorch vs TensorFlow — chọn cái nào và vì sao
Bài 13: Tensor — cấu trúc dữ liệu cốt lõi của PyTorch
Bài 14: GPU và CUDA — chuyển tensor giữa CPU / GPU
Bài 15: Autograd — PyTorch tự động tính gradient
Bài 16: nn.Module — xây dựng mạng neural đầu tiên
Bài 17: Optimizer cơ bản: SGD và Adam
Bài 18: Viết Training Loop chuẩn trong PyTorch
Bài 19: Dataset và DataLoader — quản lý batch dữ liệu
Bài 20: Weight Initialization — Xavier và He initialization

Module 3: Regularization & Optimization

Bài 21: Overfitting trong Deep Learning — dấu hiệu nhận biết
Bài 22: Dropout — bỏ ngẫu nhiên neuron khi train
Bài 23: Batch Normalization — chuẩn hóa giữa các layer
Bài 24: Early Stopping và Model Checkpoint
Bài 25: Learning Rate Scheduling — giảm LR theo thời gian
Bài 26: Data Augmentation cơ bản — tăng dữ liệu bằng biến đổi

Module 4: CNN cho ảnh

Bài 27: Vì sao MLP không hiệu quả cho ảnh
Bài 28: Convolutional Layer — kernel và feature map
Bài 29: Pooling Layer — Max Pooling và Average Pooling
Bài 30: Flatten và Fully Connected ở cuối CNN
Bài 31: Xây dựng mô hình phân loại ảnh CIFAR-10 từ đầu
Bài 32: Transfer Learning — fine-tune ResNet pretrained
Bài 33: Các kiến trúc CNN nổi bật: VGG, ResNet, EfficientNet (overview)

Module 5: RNN cho dữ liệu chuỗi

Bài 34: Sequential Data — vì sao cần kiến trúc khác MLP / CNN
Bài 35: Vanilla RNN — cơ chế lan truyền trạng thái ẩn
Bài 36: Vanishing Gradient — vấn đề cốt lõi của RNN
Bài 37: LSTM — cổng input, forget, output
Bài 38: GRU — biến thể đơn giản hơn của LSTM
Bài 39: Ứng dụng LSTM cho dự đoán chuỗi thời gian
Bài 40: Sequence-to-Sequence intuition — encoder-decoder cho dịch máy

Module 6: Nền tảng Generative

Bài 41: Autoencoder — học biểu diễn nén dữ liệu
Bài 42: Denoising Autoencoder — học biểu diễn robust
Bài 43: Variational Autoencoder (VAE) intuition — sinh dữ liệu mới
Bài 44: GAN intuition — Generator vs Discriminator

ai-engineer series