Danh sách bài viết

Deep Learning

Hiểu neural network hoạt động và train được deep learning model cơ bản.

23/05/2026
10-12 tuần đọc
0 lượt xem

Module 1: Nền tảng ANN

  • Bài 1: Tại sao Deep Learning? Phân biệt với ML cổ điển
  • Bài 2: Perceptron — đơn vị tính toán cơ bản nhất
  • Bài 3: Multi-Layer Perceptron (MLP) — chồng nhiều layer
  • Bài 4: Forward Propagation — luồng dữ liệu đi qua mạng
  • Bài 5: Activation function: Sigmoid và vấn đề saturation
  • Bài 6: Activation function: ReLU và biến thể (LeakyReLU)
  • Bài 7: Activation function: Tanh
  • Bài 8: Activation function: Softmax cho multi-class
  • Bài 9: Loss function cho regression: MSE, MAE
  • Bài 10: Loss function cho classification: Cross-Entropy
  • Bài 11: Backpropagation — chain rule và cập nhật trọng số

Module 2: PyTorch

  • Bài 12: PyTorch vs TensorFlow — chọn cái nào và vì sao
  • Bài 13: Tensor — cấu trúc dữ liệu cốt lõi của PyTorch
  • Bài 14: GPU và CUDA — chuyển tensor giữa CPU / GPU
  • Bài 15: Autograd — PyTorch tự động tính gradient
  • Bài 16: nn.Module — xây dựng mạng neural đầu tiên
  • Bài 17: Optimizer cơ bản: SGD và Adam
  • Bài 18: Viết Training Loop chuẩn trong PyTorch
  • Bài 19: Dataset và DataLoader — quản lý batch dữ liệu
  • Bài 20: Weight Initialization — Xavier và He initialization

Module 3: Regularization & Optimization

  • Bài 21: Overfitting trong Deep Learning — dấu hiệu nhận biết
  • Bài 22: Dropout — bỏ ngẫu nhiên neuron khi train
  • Bài 23: Batch Normalization — chuẩn hóa giữa các layer
  • Bài 24: Early Stopping và Model Checkpoint
  • Bài 25: Learning Rate Scheduling — giảm LR theo thời gian
  • Bài 26: Data Augmentation cơ bản — tăng dữ liệu bằng biến đổi

Module 4: CNN cho ảnh

  • Bài 27: Vì sao MLP không hiệu quả cho ảnh
  • Bài 28: Convolutional Layer — kernel và feature map
  • Bài 29: Pooling Layer — Max Pooling và Average Pooling
  • Bài 30: Flatten và Fully Connected ở cuối CNN
  • Bài 31: Xây dựng mô hình phân loại ảnh CIFAR-10 từ đầu
  • Bài 32: Transfer Learning — fine-tune ResNet pretrained
  • Bài 33: Các kiến trúc CNN nổi bật: VGG, ResNet, EfficientNet (overview)

Module 5: RNN cho dữ liệu chuỗi

  • Bài 34: Sequential Data — vì sao cần kiến trúc khác MLP / CNN
  • Bài 35: Vanilla RNN — cơ chế lan truyền trạng thái ẩn
  • Bài 36: Vanishing Gradient — vấn đề cốt lõi của RNN
  • Bài 37: LSTM — cổng input, forget, output
  • Bài 38: GRU — biến thể đơn giản hơn của LSTM
  • Bài 39: Ứng dụng LSTM cho dự đoán chuỗi thời gian
  • Bài 40: Sequence-to-Sequence intuition — encoder-decoder cho dịch máy

Module 6: Nền tảng Generative

  • Bài 41: Autoencoder — học biểu diễn nén dữ liệu
  • Bài 42: Denoising Autoencoder — học biểu diễn robust
  • Bài 43: Variational Autoencoder (VAE) intuition — sinh dữ liệu mới
  • Bài 44: GAN intuition — Generator vs Discriminator