Danh sách bài viết

Bài 3: Thiết lập Google Colab — môi trường code AI không cần cài đặt

Google Colab là Jupyter notebook chạy trên cloud của Google, dùng miễn phí, có sẵn các thư viện AI phổ biến (numpy, pandas, matplotlib, scikit-learn, PyTorch, transformers). Bài này hướng dẫn truy cập Colab, tạo notebook mới, chạy dòng code Python đầu tiên, các phím tắt cốt lõi, cách bật GPU runtime và những giới hạn của bản miễn phí cần biết trước.

24/05/2026
10 phút đọc
0 lượt xem
1

Mục Tiêu Bài Học

Sau khi hoàn thành bài này, bạn sẽ:

  • Hiểu Colab là gì và quan hệ với Jupyter notebook
  • Biết khi nào nên dùng Colab, khi nào nên cài Python local
  • Mở Colab, tạo notebook mới, đổi tên, lưu vào Google Drive
  • Chạy được dòng code Python đầu tiên trên cloud
  • Thuộc 3 phím tắt cốt lõi để thao tác cell
  • Biết bật GPU runtime và các giới hạn của bản miễn phí
2

Google Colab Là Gì

Google Colaboratory (gọi tắt là Colab) là dịch vụ Jupyter notebook chạy trên cloud của Google. Theo trang chính thức, Colab là "a hosted Jupyter Notebook service that requires no setup to use and provides free of charge access to computing resources, including GPUs and TPUs".

Vắn tắt 3 ý:

  • Hosted: code chạy trên máy ảo (VM) của Google, không phải máy bạn.
  • Jupyter notebook: file .ipynb gồm các cell code và text xen kẽ — chạy được từng cell một, thấy kết quả ngay dưới cell.
  • No setup: không phải cài Python, không phải cài pip, không phải cấu hình PATH. Mở trình duyệt, đăng nhập Google, bắt đầu code.

Notebook tạo trong Colab mặc định lưu vào Google Drive của bạn (folder Colab Notebooks), nên không lo mất file khi đóng tab.

Colab có 3 phiên bản:

  • Colab Free: miễn phí, có giới hạn (xem mục 11). Đủ cho toàn bộ series này.
  • Colab Pro: trả phí theo tháng, ưu tiên GPU tốt hơn, runtime lâu hơn.
  • Colab Pro+: gói cao hơn Pro, background execution.

Bài này và cả series chỉ dùng bản Free.

3

Vì Sao Người Mới Nên Bắt Đầu Bằng Colab

1. Không tốn thời gian cài đặt. Cài Python, pip, virtualenv, conda, fix PATH trên Windows, fix quyền trên macOS — với người mới có thể mất nửa ngày trước khi viết được dòng code đầu tiên. Colab bỏ qua toàn bộ bước này.

2. Các thư viện AI phổ biến đã sẵn có. Khi mở notebook mới trên Colab, bạn có thể import ngay các thư viện sau mà không cần cài thêm:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sklearn
import torch
import transformers

Đây là các thư viện sẽ dùng xuyên suốt series (numpy, pandas, matplotlib) và các series sau (sklearn cho ML, PyTorch cho Deep Learning, transformers cho LLM).

3. Có sẵn GPU/TPU miễn phí. Khi đến phần Deep Learning, train model trên CPU có thể mất hàng giờ. GPU rút ngắn xuống còn vài phút. Laptop bình thường không có GPU NVIDIA — Colab Free cho dùng miễn phí (có giới hạn theo lượt truy cập).

4. Cùng môi trường, không có lỗi "máy mình thì chạy nhưng máy người kia thì không". Mọi người mở cùng 1 notebook trên Colab đều dùng chung version Python, version library. Tiện cho học và chia sẻ code.

5. Chạy được trên Chromebook, iPad, máy yếu. Vì code chạy trên cloud, máy bạn chỉ cần trình duyệt.

4

Colab vs Python Local vs Jupyter Local

3 cách phổ biến để chạy Python cho AI:

  • Colab — Jupyter trên cloud của Google.
  • Jupyter local — Cài jupyter trên máy mình, chạy notebook trong trình duyệt nhưng kernel chạy trên máy local.
  • Python local + IDE — Cài Python, dùng VS Code / PyCharm chạy file .py bình thường.

Khi nào dùng cái gì:

  • Học, thử nghiệm, làm bài tập, train model nhỏColab. Nhanh, không cài đặt, có GPU.
  • Project có code structure (nhiều file, module, test)Python local + VS Code. Notebook không thay thế được IDE khi project lớn.
  • Train model lâu, dataset lớn, không muốn phụ thuộc cloudJupyter local hoặc Python local nếu máy đủ mạnh.
  • Cần GPU nhưng không có GPU localColab (free hoặc Pro), hoặc thuê GPU theo giờ (Kaggle, Paperspace, Lambda Labs, RunPod).

Series này dùng Colab vì tập trung vào học khái niệm, không phải build sản phẩm.

5

Truy Cập Colab Lần Đầu

Bước 1. Bạn cần một Google account (Gmail). Nếu chưa có, đăng ký ở accounts.google.com.

Bước 2. Mở trình duyệt, vào địa chỉ:

https://colab.research.google.com

Bước 3. Lần đầu vào, Colab hiện popup "Open notebook" với các tab:

  • Examples — notebook mẫu của Google.
  • Recent — notebook mới mở gần đây (rỗng nếu lần đầu).
  • Google Drive — notebook đã lưu trong Drive.
  • GitHub — mở notebook từ repo public.
  • Upload — upload file .ipynb từ máy.

Bước 4. Đóng popup (click X góc trên phải) để vào màn hình chính, hoặc click "New notebook" ở góc dưới phải để tạo notebook mới luôn (xem mục 6).

Bước 5. Bookmark colab.research.google.com để lần sau truy cập nhanh.

6

Tạo Notebook Mới, Đổi Tên, Lưu Vào Drive

Tạo notebook mới

Từ trang chủ Colab: File → New notebook. Hoặc từ popup "Open notebook", click "New notebook" ở góc dưới phải.

Notebook mới sẽ:

  • Có tên mặc định kiểu Untitled0.ipynb, Untitled1.ipynb...
  • Được tự động lưu vào folder Colab Notebooks trong Google Drive của bạn.
  • Có sẵn 1 cell code trống ở giữa màn hình.

Đổi tên notebook

Có 2 cách:

  • Click vào tên Untitled0.ipynb ở góc trên trái → gõ tên mới → Enter.
  • Hoặc menu File → Rename.

Ví dụ đặt tên: bai-3-hello-ai.ipynb. Phần đuôi .ipynb giữ nguyên.

Lưu notebook

Colab auto-save mỗi vài giây vào Drive. Khi muốn lưu thủ công:

  • Ctrl + S (Windows / Linux) hoặc Cmd + S (macOS).
  • Hoặc menu File → Save.

Để mở lại notebook sau này: vào drive.google.com → folder Colab Notebooks → click vào file .ipynb.

7

Chạy Cell Code Python Đầu Tiên

Bước 1. Click vào cell code trống. Con trỏ nhảy vào trong cell.

Bước 2. Gõ:

print("Hello AI")

Bước 3. Nhấn Shift + Enter để chạy cell.

Bước 4. Quan sát:

  • Lần đầu chạy, Colab mất vài giây để kết nối runtime (cấp máy ảo cho bạn). Góc trên phải hiện trạng thái Connecting → Initializing → Connected.
  • Sau khi chạy xong, ngay dưới cell xuất hiện output:
Hello AI

Đây là dòng code Python đầu tiên bạn chạy trên cloud của Google.

Thêm cell mới và chạy tiếp

Sau khi chạy Shift + Enter, Colab tự thêm cell mới phía dưới (hoặc focus cell tiếp theo nếu đã có). Gõ tiếp:

a = 3
b = 4
print(a + b)

Shift + Enter → output:

7

Lưu ý quan trọng: biến tồn tại xuyên cell

Biến a, b tạo ở cell trên vẫn dùng được ở cell dưới — vì chúng chia sẻ chung 1 Python kernel. Đây là điểm cốt lõi của notebook (chi tiết hơn ở Bài 4).

# cell tiếp theo, gõ:
print(a * b)
# Output: 12
8

Phím Tắt Cốt Lõi

Colab có rất nhiều phím tắt. Ở giai đoạn này chỉ cần thuộc 3 phím:

Phím tắt Tác dụng
Shift + Enter Chạy cell hiện tại, focus sang cell dưới
Ctrl + M B Thêm cell mới bên dưới cell hiện tại
Ctrl + M A Thêm cell mới bên trên cell hiện tại

Cách gõ phím tắt 2 thì Ctrl + M B: Giữ Ctrl, nhấn M, thả ra, rồi nhấn B. Trên macOS dùng Cmd + M B.

Vài phím tắt khác sẽ gặp dần, không cần thuộc ngay:

  • Ctrl + Enter — chạy cell hiện tại, KHÔNG nhảy sang cell dưới.
  • Alt + Enter — chạy cell hiện tại, chèn cell mới phía dưới.
  • Ctrl + M D — xoá cell hiện tại (nhấn 2 lần D nếu cần xác nhận).

Xem toàn bộ phím tắt: menu Tools → Keyboard shortcuts hoặc Ctrl + M H.

9

Cell Code vs Cell Text (Markdown)

Notebook có 2 loại cell:

  • Code cell — chứa Python, chạy được. Mặc định khi tạo cell mới.
  • Text cell — chứa Markdown, dùng để ghi chú, viết tiêu đề, công thức.

Tạo text cell

Trên thanh công cụ của Colab có 2 nút + Code+ Text (góc trên trái dưới menu). Click + Text để thêm text cell.

Ví dụ nội dung text cell:

# Bài 3 — Hello AI

Đây là notebook đầu tiên của tôi.

- Mục tiêu: in ra "Hello AI"
- Thực hành phím tắt

Sau khi gõ Markdown xong, nhấn Shift + Enter để render text cell (chuyển từ chế độ edit sang chế độ hiển thị).

Khi nào dùng text cell

  • Ghi mục tiêu, mô tả từng bước thí nghiệm.
  • Viết công thức toán bằng LaTeX (Colab hỗ trợ qua MathJax): ví dụ $f(x) = x^2$ sẽ hiển thị thành công thức.
  • Trình bày kết quả khi share notebook cho người khác.

Quy trình làm việc cell-by-cell sẽ được trình bày kỹ ở Bài 4.

10

Bật GPU / TPU Runtime

Mặc định notebook dùng CPU. Khi cần train model deep learning, đổi sang GPU.

Cách bật GPU

  1. Menu Runtime → Change runtime type.
  2. Trong dropdown "Hardware accelerator", chọn T4 GPU (hoặc TPU nếu cần).
  3. Click Save.

Colab sẽ restart runtime — biến và thư viện đã import phải chạy lại từ đầu.

Kiểm tra GPU đã bật chưa

Gõ vào cell:

import torch
print("GPU available:", torch.cuda.is_available())
print("Device name:", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "CPU only")

Output mong muốn khi GPU đã bật:

GPU available: True
Device name: Tesla T4

Lưu ý

  • Ở các bài Toán + NumPy + Pandas đầu series, KHÔNG cần GPU. Để runtime ở CPU để không tốn quota GPU.
  • GPU trên Colab Free có quota — dùng quá nhiều sẽ bị giới hạn vài giờ / vài ngày.
  • Loại GPU được cấp tuỳ thời điểm, phổ biến nhất hiện tại là Tesla T4.
11

Giới Hạn Của Colab Free

Để không bị bất ngờ giữa lúc chạy:

1. Thời gian chạy tối đa

Theo FAQ chính thức của Colab, notebook chạy "for at most 12 hours, depending on availability and your usage patterns". Tức là tối đa 12 giờ liên tục, có thể ngắn hơn nếu tài nguyên thiếu.

2. Idle timeout

Nếu để tab Colab idle (không tương tác) một thời gian, runtime sẽ bị ngắt. Khi bị ngắt:

  • Code, file notebook vẫn còn (lưu trong Drive).
  • Nhưng biến trong memory, file tạm upload, thư viện pip install thêm sẽ mất hết → phải chạy lại notebook từ đầu.

Trong lúc dùng, để giữ runtime: mở tab Colab và thi thoảng chạy 1 cell bất kỳ.

3. RAM và disk

Colab Free cấp VM với standard system memory profile (theo FAQ). Thực tế quan sát: khoảng ~12 GB RAM~100 GB disk trên CPU runtime tiêu chuẩn. Khi bật GPU, RAM tương tự, có thêm VRAM của GPU (T4: ~15 GB VRAM).

Số liệu trên KHÔNG được Google cam kết — Google có quyền thay đổi và phân bổ tuỳ thời điểm. Để xem RAM hiện tại của runtime đang chạy: góc trên phải, hover vào ô RAM / Disk.

4. File upload không bền

File upload trực tiếp vào notebook (panel Files bên trái) chỉ tồn tại theo session. Khi runtime restart hoặc idle timeout → mất. Để giữ lâu dài: lưu vào Google Drive, mount Drive vào notebook (sẽ học sau).

5. GPU quota

GPU Free không có quota công khai cố định. Dùng nhiều → Colab giảm ưu tiên cấp GPU cho bạn → vài giờ sau mới được cấp lại. Khi học Deep Learning thật, cân nhắc Colab Pro hoặc Kaggle Kernels (cũng có GPU free, quota theo tuần).

Vì sao nói trước những giới hạn này

Khi train model 8 giờ và runtime bị idle timeout ở giờ thứ 4, toàn bộ tiến trình mất. Biết trước → thiết kế code để checkpoint (lưu model định kỳ ra Drive) hoặc chia nhỏ training. Phần kỹ thuật này nằm ở các series sau.

12

Checklist Cuối Bài

Trước khi sang Bài 4, bạn nên đã làm được:

  • Truy cập colab.research.google.com bằng Google account.
  • Tạo notebook mới, đổi tên thành bai-3-hello-ai.ipynb.
  • Chạy thành công print("Hello AI") và thấy output ngay dưới cell.
  • Tạo thêm 1 cell mới bằng Ctrl + M B, gõ phép tính, chạy bằng Shift + Enter.
  • Tạo 1 text cell mô tả mục tiêu notebook.
  • Mở menu Runtime → Change runtime type và biết chỗ đổi sang GPU (chưa cần bật).
  • Mở Google Drive, thấy file .ipynb trong folder Colab Notebooks.

Nếu một mục chưa làm được, quay lại đúng mục tương ứng trong bài này để thử lại.

13

Bài Tiếp Theo

Bài 4: Notebook (.ipynb) là gì và quy trình làm việc theo cell — đi sâu vào cấu trúc file .ipynb, kernel, thứ tự chạy cell, lỗi thường gặp khi chạy cell không tuần tự, và cách tổ chức notebook cho 1 thí nghiệm AI điển hình.