Hướng Dẫn Chạy DeepSeek R1 (Local) Trên Máy Tính Cá Nhân: Tạm Biệt API Cost
Bạn có muốn sở hữu một con AI thông minh ngang ngửa OpenAI o1, nhưng chạy hoàn toàn trên máy tính của bạn, miễn phí 100% và không bao giờ lo lộ dữ liệu?
Nghe như quảng cáo lùa gà? Không hề. Chào mừng bạn đến với thế giới của Local LLM. Hôm nay, Cường sẽ hướng dẫn anh em cách cài đặt DeepSeek R1 – Model mã nguồn mở đang “làm mưa làm gió” cộng đồng Dev tuần qua.
1. Tại sao lại phải khổ sở chạy Local?
Tại sao không cứ dùng ChatGPT cho sướng? Có 3 lý do khiến anh em Dev “hardcore” thích Local:
- Privacy (Riêng tư tuyệt đối): Bạn có dám paste cả đoạn code dự án mật của công ty lên ChatGPT không? Chắc chắn là KHÔNG. Nhưng với Local LLM, dữ liệu không bao giờ rời khỏi máy tính của bạn.
- Cost (Chi phí = 0): DeepSeek R1 có logic cực mạnh (Reasoning Model). Nếu dùng API, bạn sẽ tốn kha khá tiền token. Chạy Local thì chỉ tốn tiền điện.
- Tự do: Không giới hạn rate limit, không bị API downtime, không bị kiểm duyệt nội dung gắt gao.
2. Chuẩn bị “Đồ chơi” (Phần cứng)
Để chạy mượt, máy bạn cần đủ khỏe. LLM ăn RAM (và VRAM) như uống nước lã.
- MacBook (M1/M2/M3): Đây là lựa chọn ngon nhất hiện nay nhờ kiến trúc Unified Memory.
- RAM 8GB: Chạy được model size 1.5b hoặc 7b (hơi đuối).
- RAM 16GB: Chạy ngon model 7b/8b (DeepSeek R1 Distill Llama 8B). <- Khuyên dùng
- RAM 32GB+: Cân được model 32b (thông minh hơn nhiều).
- Windows (NVIDIA GPU):
- VRAM 8GB (RTX 3060/4060): Chạy tốt model 7b/8b.
- Không có GPU rời? Chạy bằng CPU cũng được nhưng chậm như rùa bò.
3. Bước 1: Cài đặt Ollama (Trái tim của Local AI)
Chúng ta sẽ không cài thủ công từng thư viện Python. Chúng ta dùng Ollama – công cụ giúp chạy LLM dễ như chạy Docker.

Tải và cài đặt:
- Truy cập: ollama.com -> Download.
- Cài xong, mở Terminal lên và gõ lệnh sau để kiểm tra:
ollama --version(Nếu hiện version là ngon).
Kéo model DeepSeek R1 về: Chúng ta sẽ dùng bản DeepSeek-R1-Distill-Llama-8B (bản này nhẹ, thông minh, phù hợp đa số máy). Gõ lệnh:
ollama run deepseek-r1
(Lưu ý: Nó sẽ tải khoảng 4.7GB. Anh em pha cốc cafe chờ nhé).
Tải xong, bạn có thể chat ngay trong Terminal. Nhưng màn hình đen sì nhìn chán đời lắm. Sang bước 2 nào.
4. Bước 2: Cài đặt Giao diện (Open WebUI)
Chúng ta sẽ cài Open WebUI – một giao diện mã nguồn mở đẹp y hệt ChatGPT, có đầy đủ tính năng: Lưu lịch sử chat, Upload file, Voice…
Cách cài nhanh nhất (qua Docker): (Yêu cầu máy đã cài Docker Desktop nhé)
Copy lệnh này vào Terminal:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
Chờ khoảng 2 phút cho nó pull image và khởi động. Sau đó, mở trình duyệt truy cập: http://localhost:3000
Bùm! Bạn đã có một ChatGPT phiên bản “cây nhà lá vườn”. Nhớ tạo tài khoản Admin (lưu trên máy bạn thôi, không gửi đi đâu cả).
5. Bước 3: Test hiệu năng
Trong Open WebUI, chọn model deepseek-r1 ở góc trên cùng. Thử hỏi nó một câu logic:
“Giải thích cho tôi nghe tại sao 0.1 + 0.2 không bằng 0.3 trong lập trình?”
Bạn sẽ thấy điều kỳ diệu: Nó sẽ hiện ra thẻ (Suy nghĩ) trước khi trả lời. Đó chính là Reasoning Process (Quy trình suy luận) – thứ làm nên tên tuổi của dòng model o1/R1.
6. Kết luận: Tự do nằm trong tay bạn
Vậy là xong. Bạn vừa tiết kiệm được 20$/tháng tiền ChatGPT Plus, và quan trọng hơn, bạn làm chủ hoàn toàn công nghệ.
Sắp tới, Cường sẽ hướng dẫn cách kết nối con DeepSeek R1 Local này vào OpenClaw để tạo thành một Agent tự động biết viết code và deploy web. Anh em đón chờ nhé!
Link hữu ích:
- Ollama: ollama.com
- Open WebUI GitHub: github.com/open-webui/open-webui
Danh sách bài viết trước
- AI là gì? Giải thích đơn giản trong 15 phút (Series AI Cơ bản #1)
- Đừng Dùng ChatGPT Như Google (Series AI Cơ Bản #2)
- Tại Sao AI Hay “Nói Điêu”? (Series AI Cơ Bản #3)
- Bí Mật Của Token: Tại Sao AI Hay “Quên”? (Series AI Cơ Bản #4)
- Công thức RCIO: Cách Viết PROMPT Giao Việc Cho AI
- n8n là gì? Vũ khí tự động hóa “Fair-code” mạnh mẽ thay thế Zapier (2026)
- Hướng dẫn n8n cho người mới: Tự động hóa công việc chỉ với 3 bước (2026)
- Tự động hóa Marketing với n8n: 7 cách tôi tiết kiệm 20 giờ mỗi tuần (Bí kíp thực chiến)
- ClawdBot là gì? Biến Telegram thành Trợ lý AI Cá nhân miễn phí (2026)
- Hướng dẫn tích hợp Ollama vào ClawdBot: Sở hữu Trợ lý AI chạy Local “0 đồng” (2026)
- Dạy ClawdBot “Lướt web” (Browser Control): Tự động điền form và săn sale (2026)
- Biến Notion từ “Kho chứa” thành “Trợ lý sống” với ClawdBot (2026)
— Cường Nguyễn (Richard)
AI Automation Architect | Founder, AI Ops Solutions
Facebook | Linkedin
Muốn nhận thêm bài viết thực chiến về AI mỗi tuần?Tôi gửi 1 email/tuần, chia sẻ cách ứng dụng AI vào công việc thực tế và cập nhật tin tức mới nhất về AI. Không spam, không bán khóa học, chỉ có kiến thứcc
Đăng ký theo dõi tại đây


