Kinh doanh và tài chính

Liang Wenfeng: người sáng lập DeepSeek tạo ra cuộc cách mạng AI chỉ với 6 triệu đô la

Penelope H. Fritz
Liang Wenfeng
Liang Wenfeng
Sinh1 tháng 1, 1985
Zhanjiang
Nghề nghiệpDoanh nhân công nghệ và nhà nghiên cứu AI
Giải thưởngTime 100 u00b7 Nature's 10

Câu hỏi mà Silicon Valley không thể trả lời trong những tháng sau khi DeepSeek xuất hiện không phải là câu hỏi kỹ thuật. Đó là câu hỏi triết học. Nếu một nhóm chưa đến hai trăm kỹ sư, làm việc ở Hàng Châu với phần cứng mà các biện pháp kiểm soát xuất khẩu của Mỹ được cho là nhằm hạn chế, có thể tạo ra một mô hình cạnh tranh với những mô hình tốt nhất thế giới với chi phí chỉ bằng một phần nhỏ — thì tất cả số tiền đó dùng để làm gì? Liang Wenfeng là người đặt ra câu hỏi đó. Ông không ở lại để nghe cuộc tranh luận.

Wuchuan, thành phố ven biển ở tỉnh Quảng Đông nơi ông lớn lên, không xuất hiện trong những câu chuyện thông thường về nguồn gốc của trí tuệ nhân tạo. Cha mẹ ông là giáo viên tiểu học. Ông tự học giải tích nâng cao ở trường trung học cơ sở, đạt điểm cao nhất vùng Trạm Giang trong kỳ thi đại học và trúng tuyển vào Đại học Chiết Giang ở tuổi mười bảy. Ông học kỹ thuật thông tin điện tử rồi hoàn thành bằng thạc sĩ kỹ thuật thông tin và truyền thông, với luận văn về thuật toán theo dõi vật thể bằng camera. Chủ đề nghiên cứu khá khiêm tốn, nhưng tư duy nền tảng — toán học ứng dụng để giải quyết các vấn đề thực tế trong điều kiện ràng buộc — sẽ định hình tất cả những gì diễn ra sau đó.

Khi cuộc khủng hoảng tài chính năm 2008 làm rung chuyển các thị trường, ông bắt đầu thử nghiệm học máy trong giao dịch tài chính. Sau thời gian ở Thành Đô và một số dự án đầu tiên, năm 2016 ông đồng sáng lập High-Flyer Capital Management (幻方量化) ở Hàng Châu cùng hai bạn học từ Đại học Chiết Giang. Công ty trở thành một trong những quỹ phòng hộ định lượng thành công nhất Trung Quốc, quản lý hơn bảy mươi tỷ nhân dân tệ và đạt lợi nhuận trung bình hơn năm mươi phần trăm trong năm 2025. Lợi thế đến từ thuật toán: các mô hình học sâu chạy trên cơ sở hạ tầng GPU mà Liang đã tích lũy ở quy mô lớn. Đến năm 2021, ông đã mua chip Nvidia A100 với số lượng gợi ý đến những kế hoạch tham vọng hơn nhiều so với một hoạt động giao dịch thông thường.

Cơ sở hạ tầng đó trở thành nền tảng cho DeepSeek, mà Liang thành lập như một công ty tách nhánh vào tháng 7 năm 2023. Mục tiêu được tuyên bố của công ty không phải là xây dựng một chatbot hay sản phẩm thương mại, mà là theo đuổi điều ông mô tả là nghiên cứu cơ bản về trí tuệ nhân tạo — loại công việc không có lộ trình sản phẩm hay mục tiêu hàng quý. DeepSeek có khoảng một trăm sáu mươi nhân viên được tuyển dụng từ nhiều lĩnh vực khác nhau một cách có chủ đích, và hoạt động với ngân sách mà ở OpenAI hay Google DeepMind có lẽ chẳng ai để ý. Khi DeepSeek-V3 được phát hành cuối năm 2024, chi phí huấn luyện được ước tính khoảng sáu triệu đô la. Khi DeepSeek-R1 tiếp theo vào tháng 1 năm 2025 và đứng đầu App Store iOS tại Mỹ, vượt qua ChatGPT, con số được trích dẫn là năm phẩy sáu triệu đô la.

Câu chuyện gián đoạn gắn liền với DeepSeek gần như ngay lập tức không hoàn toàn sai, nhưng còn thiếu sót ở những điểm quan trọng. Cơ sở hạ tầng GPU của High-Flyer được xây dựng trước khi các hạn chế xuất khẩu nghiêm ngặt nhất có hiệu lực. Những lựa chọn kỹ thuật tạo ra các mô hình hiệu quả với chi phí huấn luyện thấp đòi hỏi chuyên môn sâu bất thường. Điều DeepSeek chứng minh không phải là việc xây dựng các mô hình AI lớn thì rẻ; mà là đổi mới kiến trúc có thể nén chi phí biên để huấn luyện một mức năng lực nhất định.

Vào tháng 2 năm 2025, Liang tham dự một hội thảo với Chủ tịch Tập Cận Bình cùng một số lãnh đạo công nghệ nổi bật nhất Trung Quốc. Đó là khoảnh khắc công khai nổi bật nhất của ông. Từ đó đến nay ông không xuất hiện trước công chúng. DeepSeek phát hành bản xem trước V4 vào tháng 4 năm 2026 và theo các báo cáo đang tìm kiếm ba trăm triệu đô la đầu tư mới ở mức định giá mười tỷ. Cổ phần của ông — khoảng tám mươi bốn phần trăm qua sở hữu trực tiếp và gián tiếp — cho ông cả quyền kiểm soát lẫn, rõ ràng là, sự tự do để ở bất cứ đâu trừ trước microphone.

Về cuộc sống riêng tư, ông không lưu giữ gì trong hồ sơ công khai. Không có thông tin được xác minh về vợ hay con. Ông không có sự hiện diện công khai trên mạng xã hội trước khi DeepSeek thành tin tức toàn cầu, và cũng không có sau đó.

DeepSeek sẽ phát hành thêm nhiều mô hình. Quỹ đạo của công ty kể từ thời điểm R1 không có dấu hiệu chậm lại. Điều vẫn còn thực sự không chắc chắn là liệu Liang Wenfeng có xuất hiện để nói điều gì đó về tất cả những điều này hay không — hay liệu công việc có tiếp tục nói thay ông ở nơi ông đã chọn im lặng.

Thẻ: , , , , ,

Thảo luận

Có 0 bình luận.