DeepSeek V4 rẻ hơn GPT-5 năm lần, hoạt động không cần chip Nvidia

DeepSeek vừa công bố bản preview của V4-Pro và V4-Flash — hai mô hình ngôn ngữ mã nguồn mở khẳng định một luận điểm: xử lý một triệu token ngữ cảnh không còn là bài toán dung lượng mà chỉ là vấn đề hiệu suất. V4-Pro có 1,6 nghìn tỷ tham số, trong đó 49 tỷ hoạt động mỗi truy vấn — đủ để xử lý toàn bộ kho mã nguồn hoặc một cuốn sách trong một lần gọi. Lần đầu tiên, một mô hình mở cạnh tranh nghiêm túc với mô hình đóng hàng đầu ở toán học, lập trình và tác vụ agent — với chi phí chỉ bằng một phần nhỏ.

Cả hai mô hình đi kèm giấy phép MIT và trọng số đã được công bố trên Hugging Face. V4-Flash là phiên bản gọn nhẹ với 284 tỷ tham số tổng, 13 tỷ hoạt động — đủ nhỏ để một bản lượng tử hóa chạy trên laptop cao cấp. V4-Pro là mô hình chủ lực: 865 gigabyte, thiết kế cho triển khai đám mây và phòng thí nghiệm nghiên cứu. Cả hai đều có cửa sổ ngữ cảnh một triệu token — bước nhảy sánh ngang Gemini của Google và gấp đôi phần lớn mô hình mở cạnh tranh.

Bước đi kiến trúc then chốt mang tên Hybrid Attention: DeepSeek kết hợp hai kỹ thuật nén và đẩy chi phí bộ nhớ xuống mạnh đến mức V4-Pro ở cùng độ dài ngữ cảnh chỉ tiêu tốn 27% công suất tính toán và 10% bộ nhớ đệm so với V3.2. V4-Flash còn đi xa hơn. Thực tế: chạy một prompt một triệu token trên V4-Pro hiện rẻ hơn chạy prompt 100.000 token trên thế hệ trước. Đây là điều kiện kinh tế để các mô hình ngữ cảnh dài thoát khỏi trình diễn phòng thí nghiệm và bước vào sản xuất thương mại.

Cú phá giá là nơi đòn đánh mạnh nhất. V4-Flash có giá 0,14 USD cho mỗi triệu token đầu vào — thấp hơn cả GPT-5.4 Nano của OpenAI. V4-Pro có giá 1,74 USD cho mỗi triệu token đầu vào và 3,48 USD cho mỗi triệu token đầu ra — bằng một phần ba mức Anthropic thu cho Claude Opus 4.7 và bằng một phần năm mức OpenAI thu cho GPT-5.5. Ở các bài kiểm tra lập trình, V4-Pro đạt điểm Codeforces 3.206 — theo DeepSeek, giá trị đủ để xếp mô hình ở vị trí thứ 23 trong số các lập trình viên đua giải toàn cầu.

Chiều đọc địa chính trị quan trọng không kém benchmark. DeepSeek tối ưu hóa V4 cho chip Ascend 950 của Huawei và silicon Cambricon, không trao quyền truy cập sớm cho Nvidia hay AMD — đi ngược thông lệ ngành. Lần ra mắt là bài kiểm tra thương mại cho chuỗi công nghệ Trung Quốc — chuỗi đã chịu hạn chế xuất khẩu của Washington nhiều năm. Với châu Âu, câu hỏi trở nên khó chịu: khi Bắc Kinh xây chuỗi chủ quyền hoàn chỉnh — trọng số mở, chip nội địa, phần mềm suy luận riêng — còn Washington đóng chuỗi mình bằng luật, chủ quyền số châu Âu vẫn phụ thuộc cấu trúc vào cả hai khối.

Vẫn có lưu ý quan trọng. V4 là bản preview, không phải bản sản xuất; benchmark độc lập từ bên thứ ba chưa hoàn thành. Báo cáo kỹ thuật của chính DeepSeek thừa nhận mô hình còn cách GPT-5.4 và Gemini 3.1 Pro từ ba đến sáu tháng ở năng lực tuyến đầu. R1, phiên bản tiền nhiệm, đã bị cấm hoặc hạn chế chỉ vài tuần sau ra mắt tại nhiều bang của Mỹ, Úc, Đài Loan, Hàn Quốc, Đan Mạch và Ý — V4 thừa hưởng nguyên vẹn rủi ro pháp lý này ở các thị trường đó. Nhà thầu Lầu Năm Góc còn bị cấm dùng mô hình DeepSeek theo luật NDAA 2026 của Mỹ, trừ khi có ngoại lệ.

Ngoài các vùng hạn chế này, truy cập là ngay lập tức. Chatbot web của DeepSeek cung cấp V4-Pro qua chế độ Expert và V4-Flash qua chế độ Instant miễn phí, còn nhà phát triển có thể gọi API bằng cách đổi tên mô hình thành deepseek-v4-pro hoặc deepseek-v4-flash.

Lần ra mắt rơi đúng một năm sau khi DeepSeek-R1 làm chao đảo thị trường AI toàn cầu vào ngày 20/1/2025 — lịch được chọn có chủ ý. Giá API chính thức sau giai đoạn preview vẫn chưa công bố, và các endpoint cũ deepseek-chat và deepseek-reasoner sẽ ngừng hoạt động vào ngày 24/7/2026, khi toàn bộ lưu lượng tự động chuyển sang V4. Điều đáng chú ý ở đây vượt ra ngoài một benchmark đơn lẻ: đây là bằng chứng công khai đầu tiên cho thấy một thế lực cạnh tranh có thể cung cấp một stack AI hoàn chỉnh, cạnh tranh và giá rẻ mà không phụ thuộc vào nhà cung cấp Mỹ — và bằng chứng này, tự thân nó, vẽ lại bản đồ cho mọi chiến lược AI chủ quyền từ nay về sau.

Thẻ: tuệ nhân tạo, nvidia, Trung Quốc, DeepSeek