Mục lục
- Mục Tiêu Bài Học
- Google Colab Là Gì
- Vì Sao Người Mới Nên Bắt Đầu Bằng Colab
- Colab vs Python Local vs Jupyter Local
- Truy Cập Colab Lần Đầu
- Tạo Notebook Mới, Đổi Tên, Lưu Vào Drive
- Chạy Cell Code Python Đầu Tiên
- Phím Tắt Cốt Lõi
- Cell Code vs Cell Text (Markdown)
- Bật GPU / TPU Runtime
- Giới Hạn Của Colab Free
- Checklist Cuối Bài
- Bài Tiếp Theo
Mục Tiêu Bài Học
Sau khi hoàn thành bài này, bạn sẽ:
- Hiểu Colab là gì và quan hệ với Jupyter notebook
- Biết khi nào nên dùng Colab, khi nào nên cài Python local
- Mở Colab, tạo notebook mới, đổi tên, lưu vào Google Drive
- Chạy được dòng code Python đầu tiên trên cloud
- Thuộc 3 phím tắt cốt lõi để thao tác cell
- Biết bật GPU runtime và các giới hạn của bản miễn phí
Google Colab Là Gì
Google Colaboratory (gọi tắt là Colab) là dịch vụ Jupyter notebook chạy trên cloud của Google. Theo trang chính thức, Colab là "a hosted Jupyter Notebook service that requires no setup to use and provides free of charge access to computing resources, including GPUs and TPUs".
Vắn tắt 3 ý:
- Hosted: code chạy trên máy ảo (VM) của Google, không phải máy bạn.
- Jupyter notebook: file
.ipynbgồm các cell code và text xen kẽ — chạy được từng cell một, thấy kết quả ngay dưới cell. - No setup: không phải cài Python, không phải cài
pip, không phải cấu hình PATH. Mở trình duyệt, đăng nhập Google, bắt đầu code.
Notebook tạo trong Colab mặc định lưu vào Google Drive của bạn (folder Colab Notebooks), nên không lo mất file khi đóng tab.
Colab có 3 phiên bản:
- Colab Free: miễn phí, có giới hạn (xem mục 11). Đủ cho toàn bộ series này.
- Colab Pro: trả phí theo tháng, ưu tiên GPU tốt hơn, runtime lâu hơn.
- Colab Pro+: gói cao hơn Pro, background execution.
Bài này và cả series chỉ dùng bản Free.
Vì Sao Người Mới Nên Bắt Đầu Bằng Colab
1. Không tốn thời gian cài đặt. Cài Python, pip, virtualenv, conda, fix PATH trên Windows, fix quyền trên macOS — với người mới có thể mất nửa ngày trước khi viết được dòng code đầu tiên. Colab bỏ qua toàn bộ bước này.
2. Các thư viện AI phổ biến đã sẵn có. Khi mở notebook mới trên Colab, bạn có thể import ngay các thư viện sau mà không cần cài thêm:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sklearn
import torch
import transformers
Đây là các thư viện sẽ dùng xuyên suốt series (numpy, pandas, matplotlib) và các series sau (sklearn cho ML, PyTorch cho Deep Learning, transformers cho LLM).
3. Có sẵn GPU/TPU miễn phí. Khi đến phần Deep Learning, train model trên CPU có thể mất hàng giờ. GPU rút ngắn xuống còn vài phút. Laptop bình thường không có GPU NVIDIA — Colab Free cho dùng miễn phí (có giới hạn theo lượt truy cập).
4. Cùng môi trường, không có lỗi "máy mình thì chạy nhưng máy người kia thì không". Mọi người mở cùng 1 notebook trên Colab đều dùng chung version Python, version library. Tiện cho học và chia sẻ code.
5. Chạy được trên Chromebook, iPad, máy yếu. Vì code chạy trên cloud, máy bạn chỉ cần trình duyệt.
Colab vs Python Local vs Jupyter Local
3 cách phổ biến để chạy Python cho AI:
- Colab — Jupyter trên cloud của Google.
- Jupyter local — Cài
jupytertrên máy mình, chạy notebook trong trình duyệt nhưng kernel chạy trên máy local. - Python local + IDE — Cài Python, dùng VS Code / PyCharm chạy file
.pybình thường.
Khi nào dùng cái gì:
- Học, thử nghiệm, làm bài tập, train model nhỏ → Colab. Nhanh, không cài đặt, có GPU.
- Project có code structure (nhiều file, module, test) → Python local + VS Code. Notebook không thay thế được IDE khi project lớn.
- Train model lâu, dataset lớn, không muốn phụ thuộc cloud → Jupyter local hoặc Python local nếu máy đủ mạnh.
- Cần GPU nhưng không có GPU local → Colab (free hoặc Pro), hoặc thuê GPU theo giờ (Kaggle, Paperspace, Lambda Labs, RunPod).
Series này dùng Colab vì tập trung vào học khái niệm, không phải build sản phẩm.
Truy Cập Colab Lần Đầu
Bước 1. Bạn cần một Google account (Gmail). Nếu chưa có, đăng ký ở accounts.google.com.
Bước 2. Mở trình duyệt, vào địa chỉ:
https://colab.research.google.com
Bước 3. Lần đầu vào, Colab hiện popup "Open notebook" với các tab:
- Examples — notebook mẫu của Google.
- Recent — notebook mới mở gần đây (rỗng nếu lần đầu).
- Google Drive — notebook đã lưu trong Drive.
- GitHub — mở notebook từ repo public.
- Upload — upload file
.ipynbtừ máy.
Bước 4. Đóng popup (click X góc trên phải) để vào màn hình chính, hoặc click "New notebook" ở góc dưới phải để tạo notebook mới luôn (xem mục 6).
Bước 5. Bookmark colab.research.google.com để lần sau truy cập nhanh.
Tạo Notebook Mới, Đổi Tên, Lưu Vào Drive
Tạo notebook mới
Từ trang chủ Colab: File → New notebook. Hoặc từ popup "Open notebook", click "New notebook" ở góc dưới phải.
Notebook mới sẽ:
- Có tên mặc định kiểu
Untitled0.ipynb,Untitled1.ipynb... - Được tự động lưu vào folder
Colab Notebookstrong Google Drive của bạn. - Có sẵn 1 cell code trống ở giữa màn hình.
Đổi tên notebook
Có 2 cách:
- Click vào tên
Untitled0.ipynbở góc trên trái → gõ tên mới → Enter. - Hoặc menu File → Rename.
Ví dụ đặt tên: bai-3-hello-ai.ipynb. Phần đuôi .ipynb giữ nguyên.
Lưu notebook
Colab auto-save mỗi vài giây vào Drive. Khi muốn lưu thủ công:
Ctrl + S(Windows / Linux) hoặcCmd + S(macOS).- Hoặc menu File → Save.
Để mở lại notebook sau này: vào drive.google.com → folder Colab Notebooks → click vào file .ipynb.
Chạy Cell Code Python Đầu Tiên
Bước 1. Click vào cell code trống. Con trỏ nhảy vào trong cell.
Bước 2. Gõ:
print("Hello AI")
Bước 3. Nhấn Shift + Enter để chạy cell.
Bước 4. Quan sát:
- Lần đầu chạy, Colab mất vài giây để kết nối runtime (cấp máy ảo cho bạn). Góc trên phải hiện trạng thái Connecting → Initializing → Connected.
- Sau khi chạy xong, ngay dưới cell xuất hiện output:
Hello AI
Đây là dòng code Python đầu tiên bạn chạy trên cloud của Google.
Thêm cell mới và chạy tiếp
Sau khi chạy Shift + Enter, Colab tự thêm cell mới phía dưới (hoặc focus cell tiếp theo nếu đã có). Gõ tiếp:
a = 3
b = 4
print(a + b)
Shift + Enter → output:
7
Lưu ý quan trọng: biến tồn tại xuyên cell
Biến a, b tạo ở cell trên vẫn dùng được ở cell dưới — vì chúng chia sẻ chung 1 Python kernel. Đây là điểm cốt lõi của notebook (chi tiết hơn ở Bài 4).
# cell tiếp theo, gõ:
print(a * b)
# Output: 12
Phím Tắt Cốt Lõi
Colab có rất nhiều phím tắt. Ở giai đoạn này chỉ cần thuộc 3 phím:
| Phím tắt | Tác dụng |
|---|---|
Shift + Enter |
Chạy cell hiện tại, focus sang cell dưới |
Ctrl + M B |
Thêm cell mới bên dưới cell hiện tại |
Ctrl + M A |
Thêm cell mới bên trên cell hiện tại |
Cách gõ phím tắt 2 thì Ctrl + M B: Giữ Ctrl, nhấn M, thả ra, rồi nhấn B. Trên macOS dùng Cmd + M B.
Vài phím tắt khác sẽ gặp dần, không cần thuộc ngay:
Ctrl + Enter— chạy cell hiện tại, KHÔNG nhảy sang cell dưới.Alt + Enter— chạy cell hiện tại, chèn cell mới phía dưới.Ctrl + M D— xoá cell hiện tại (nhấn 2 lần D nếu cần xác nhận).
Xem toàn bộ phím tắt: menu Tools → Keyboard shortcuts hoặc Ctrl + M H.
Cell Code vs Cell Text (Markdown)
Notebook có 2 loại cell:
- Code cell — chứa Python, chạy được. Mặc định khi tạo cell mới.
- Text cell — chứa Markdown, dùng để ghi chú, viết tiêu đề, công thức.
Tạo text cell
Trên thanh công cụ của Colab có 2 nút + Code và + Text (góc trên trái dưới menu). Click + Text để thêm text cell.
Ví dụ nội dung text cell:
# Bài 3 — Hello AI
Đây là notebook đầu tiên của tôi.
- Mục tiêu: in ra "Hello AI"
- Thực hành phím tắt
Sau khi gõ Markdown xong, nhấn Shift + Enter để render text cell (chuyển từ chế độ edit sang chế độ hiển thị).
Khi nào dùng text cell
- Ghi mục tiêu, mô tả từng bước thí nghiệm.
- Viết công thức toán bằng LaTeX (Colab hỗ trợ qua MathJax): ví dụ
$f(x) = x^2$sẽ hiển thị thành công thức. - Trình bày kết quả khi share notebook cho người khác.
Quy trình làm việc cell-by-cell sẽ được trình bày kỹ ở Bài 4.
Bật GPU / TPU Runtime
Mặc định notebook dùng CPU. Khi cần train model deep learning, đổi sang GPU.
Cách bật GPU
- Menu Runtime → Change runtime type.
- Trong dropdown "Hardware accelerator", chọn T4 GPU (hoặc TPU nếu cần).
- Click Save.
Colab sẽ restart runtime — biến và thư viện đã import phải chạy lại từ đầu.
Kiểm tra GPU đã bật chưa
Gõ vào cell:
import torch
print("GPU available:", torch.cuda.is_available())
print("Device name:", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU only")
Output mong muốn khi GPU đã bật:
GPU available: True
Device name: Tesla T4
Lưu ý
- Ở các bài Toán + NumPy + Pandas đầu series, KHÔNG cần GPU. Để runtime ở CPU để không tốn quota GPU.
- GPU trên Colab Free có quota — dùng quá nhiều sẽ bị giới hạn vài giờ / vài ngày.
- Loại GPU được cấp tuỳ thời điểm, phổ biến nhất hiện tại là Tesla T4.
Giới Hạn Của Colab Free
Để không bị bất ngờ giữa lúc chạy:
1. Thời gian chạy tối đa
Theo FAQ chính thức của Colab, notebook chạy "for at most 12 hours, depending on availability and your usage patterns". Tức là tối đa 12 giờ liên tục, có thể ngắn hơn nếu tài nguyên thiếu.
2. Idle timeout
Nếu để tab Colab idle (không tương tác) một thời gian, runtime sẽ bị ngắt. Khi bị ngắt:
- Code, file notebook vẫn còn (lưu trong Drive).
- Nhưng biến trong memory, file tạm upload, thư viện
pip installthêm sẽ mất hết → phải chạy lại notebook từ đầu.
Trong lúc dùng, để giữ runtime: mở tab Colab và thi thoảng chạy 1 cell bất kỳ.
3. RAM và disk
Colab Free cấp VM với standard system memory profile (theo FAQ). Thực tế quan sát: khoảng ~12 GB RAM và ~100 GB disk trên CPU runtime tiêu chuẩn. Khi bật GPU, RAM tương tự, có thêm VRAM của GPU (T4: ~15 GB VRAM).
Số liệu trên KHÔNG được Google cam kết — Google có quyền thay đổi và phân bổ tuỳ thời điểm. Để xem RAM hiện tại của runtime đang chạy: góc trên phải, hover vào ô RAM / Disk.
4. File upload không bền
File upload trực tiếp vào notebook (panel Files bên trái) chỉ tồn tại theo session. Khi runtime restart hoặc idle timeout → mất. Để giữ lâu dài: lưu vào Google Drive, mount Drive vào notebook (sẽ học sau).
5. GPU quota
GPU Free không có quota công khai cố định. Dùng nhiều → Colab giảm ưu tiên cấp GPU cho bạn → vài giờ sau mới được cấp lại. Khi học Deep Learning thật, cân nhắc Colab Pro hoặc Kaggle Kernels (cũng có GPU free, quota theo tuần).
Vì sao nói trước những giới hạn này
Khi train model 8 giờ và runtime bị idle timeout ở giờ thứ 4, toàn bộ tiến trình mất. Biết trước → thiết kế code để checkpoint (lưu model định kỳ ra Drive) hoặc chia nhỏ training. Phần kỹ thuật này nằm ở các series sau.
Checklist Cuối Bài
Trước khi sang Bài 4, bạn nên đã làm được:
- Truy cập
colab.research.google.combằng Google account. - Tạo notebook mới, đổi tên thành
bai-3-hello-ai.ipynb. - Chạy thành công
print("Hello AI")và thấy output ngay dưới cell. - Tạo thêm 1 cell mới bằng
Ctrl + M B, gõ phép tính, chạy bằngShift + Enter. - Tạo 1 text cell mô tả mục tiêu notebook.
- Mở menu Runtime → Change runtime type và biết chỗ đổi sang GPU (chưa cần bật).
- Mở Google Drive, thấy file
.ipynbtrong folderColab Notebooks.
Nếu một mục chưa làm được, quay lại đúng mục tương ứng trong bài này để thử lại.
Bài Tiếp Theo
Bài 4: Notebook (.ipynb) là gì và quy trình làm việc theo cell — đi sâu vào cấu trúc file .ipynb, kernel, thứ tự chạy cell, lỗi thường gặp khi chạy cell không tuần tự, và cách tổ chức notebook cho 1 thí nghiệm AI điển hình.
