DeepSeek làm AI rẻ đi, còn bong bóng AI của Mỹ đặt cược điều ngược lại

DeepSeek, một phòng thí nghiệm Trung Quốc bước ra từ một quỹ đầu cơ định lượng, cứ làm đúng cái điều mà ngành AI Mỹ định giá là bất khả. Nó xây những mô hình chạy sát ranh giới tiên phong, huấn luyện chúng với một phần nhỏ so với chi tiêu của các đối thủ Mỹ, rồi công bố trọng số để bất kỳ ai cũng tải về và chạy được. Mỗi lần phát hành lại mở ra cùng một cuộc tranh luận: định giá của toàn bộ ngành AI Mỹ dựa trên một giả định mà DeepSeek đang lặng lẽ tháo dỡ, rằng trí tuệ buộc phải đắt.

Giả định đó không hề trừu tượng. Nó chống đỡ hàng trăm tỷ đô la trung tâm dữ liệu đang xây, giá cổ phiếu của các hãng chip và nhà cung cấp đám mây nằm trong gần như mọi quỹ chỉ số, và khoản thuê bao hằng tháng mà nhiều bạn đọc đã trả cho một chatbot. Nếu một đối thủ cho kết quả tương đương với chi phí thấp hơn nhiều và tặng không phần mềm, khoản phụ trội gắn với sức tính toán khan hiếm và đắt đỏ trông bớt giống một hào thành mà giống một ván cược hơn.

Tuyên bố của DeepSeek là về hiệu quả, không phải phép màu. Các kỹ sư dựa vào thiết kế hỗn hợp chuyên gia chỉ đánh thức một phần mô hình cho mỗi truy vấn, dùng mạnh các phép tính độ chính xác thấp và những quy trình huấn luyện được tinh chỉnh để chạy trên ít chip hơn, một phần bị hạn chế xuất khẩu. Con số được nhắc nhiều nhất cho một trong các lượt huấn luyện chính nằm dưới sáu triệu đô la. Các lượt chạy tương đương của Mỹ được cho là tốn gấp nhiều lần khi cộng đủ hóa đơn.

Cách mô hình được phát hành quan trọng ngang với chi phí của nó. DeepSeek đưa ra trọng số mở, nên một lập trình viên ở São Paulo, một phòng thí nghiệm đại học ở Warszawa hay một startup ở Seoul có thể tải mô hình về và chạy trên máy của chính mình, không phải trả tiền cho nhà cung cấp Mỹ theo từng truy vấn và không phải gửi dữ liệu ra nước ngoài. Có một sự trớ trêu ở đây: các biện pháp kiểm soát xuất khẩu nhằm kìm AI Trung Quốc bằng cách cắt những con chip mạnh nhất dường như đã đẩy DeepSeek vắt nhiều hơn từ ít hơn, và những phương pháp tiết kiệm ấy nay đi đến mọi nơi mà trọng số mở đặt chân tới.

Với người chỉ đơn giản dùng các công cụ này, tác động tức thì là quyền lựa chọn. Mô hình rẻ hơn ép giá thuê bao đi xuống, đưa những trợ lý mạnh hơn lên máy tính xách tay và điện thoại bình thường, và làm yếu lý do để khóa mình vào một nhà cung cấp duy nhất. Thứ từng giống một dịch vụ đi thuê bắt đầu giống phần mềm mà ta có thể sở hữu.

Câu chuyện bong bóng cần những dè dặt lớn. Con số dưới sáu triệu đô la chỉ tính một lượt huấn luyện cuối cùng, không gồm nghiên cứu, những ngõ cụt, lương bổng hay phần cứng đã làm nên nó, nên đem so với tổng chi của một phòng thí nghiệm Mỹ là so hai thứ khác nhau. Trọng số mở cũng không phải mã nguồn mở; dữ liệu huấn luyện và toàn bộ phương pháp vẫn được giữ kín. Và lập luận hiệu quả cắt về cả hai phía. Khi được hỏi về DeepSeek, ban lãnh đạo Microsoft viện tới nghịch lý Jevons, quan sát xưa cũ rằng khi một nguồn lực rẻ hơn để dùng, tổng mức tiêu thụ có xu hướng tăng chứ không giảm. Trí tuệ rẻ hơn có thể đơn giản nghĩa là thế giới mua nhiều hơn hẳn, một tin tốt cho những ai bán sức tính toán, chứ không phải tin xấu.

Đây cũng không phải lần đầu bong bóng bị tuyên bố đã chết. Chính phòng thí nghiệm ấy từng châm ngòi cho mức mất vốn hóa lớn nhất trong một ngày của lịch sử Mỹ, xóa gần sáu trăm tỷ đô la khỏi một hãng chip chỉ trong một buổi chiều, rồi nhìn cổ phiếu lấy lại gần hết sau vài tuần. Các đại công ty AI Mỹ không đáp lại bằng cách chi ít hơn. Họ gọi thêm vốn và xây lớn hơn. Mọi tuyên bố rằng bong bóng cuối cùng đã vỡ phải sống sót trước sự thật rằng chính những người đặt nhiều tiền nhất trên bàn vẫn đang nhân đôi cược.

Điều DeepSeek thực sự làm khó kịch tính hóa hơn một bong bóng vỡ. Nó đã lấy đi sự yên tâm khi cho rằng các phòng thí nghiệm Mỹ dẫn đầu được che chắn bởi một bức tường vốn không ai trèo qua nổi. Nếu năng lực tiên phong có thể tiệm cận với chi phí thấp và phát không, giá trị thôi nằm ở việc sở hữu mô hình. Nó dời sang khâu phân phối, sang các sản phẩm dựng quanh mô hình và sang ai nắm được khách hàng. Bài kiểm tra kế tiếp đã nằm sẵn trên lịch, dù chưa có ngày: mỗi lần DeepSeek ra mắt lại mở cùng câu hỏi ấy và rơi vào một thị trường đã cam kết chi nhiều hơn, không phải ít hơn, với niềm tin rằng quy mô vẫn thắng. Nó sẽ ngã ngũ trong các buổi công bố kết quả và dự báo đầu tư của những quý tới, chứ không phải trong một chủ đề diễn đàn tuyên bố cuộc đấu đã xong.

Thẻ: tuệ nhân tạo, nvidia, microsoft, DeepSeek, AI bubble, open-weight AI