Công nghệ

Microsoft đàm phán với Anthropic về khách hàng đầu tiên dùng chip Maia 200

Susan Hill

Microsoft đang đàm phán với Anthropic để cung cấp chip trí tuệ nhân tạo Maia 200 do mình tự thiết kế. Nếu thỏa thuận thành, đây sẽ là lần đầu silicon này rời khỏi các trung tâm dữ liệu của chính hãng. Các cuộc thảo luận, do The Information đưa tin đầu tiên và CNBC xác nhận, biến hậu quả vận hành của một quan hệ tài chính từ lâu chỉ tồn tại trong bảng tính thành hiện thực.

Thỏa thuận đang được bàn rất hẹp nhưng nặng ký. Anthropic sẽ thuê các máy chủ Azure chạy chip Maia 200 cho khâu suy luận, giai đoạn tốn kém khi Claude trả lời người dùng, tách biệt với phần việc dễ thấy hơn là huấn luyện mô hình mới. Suy luận là nơi mọi phòng thí nghiệm tiên phong đang đốt tiền. Kinh tế đơn vị của một truy vấn, nhân với hàng trăm triệu người dùng, chính là con số quyết định ngành AI lúc này.

Với Microsoft, đưa Anthropic lên Maia 200 sẽ là sự xác nhận thương mại mạnh nhất có thể cho một chương trình chip cho đến nay chỉ tồn tại như dự án R&D nội bộ. Trainium và Inferentia của Amazon đã nằm trong tay khách hàng bên ngoài nhiều năm. TPU của Google là xương sống lặng lẽ cho phần lớn cuộc cách mạng mô hình ngôn ngữ lớn. Maia thì ngược lại, chỉ được triển khai bên trong các cơ sở của Microsoft ở Arizona và Iowa, chạy các tải AI nội bộ mà hãng không công bố chi tiết. Có được phòng thí nghiệm tiên phong được dõi theo thứ hai trên thế giới sẽ biến con chip thành sản phẩm thương mại chỉ qua một đêm.

Logic tài chính đã sẵn sàng. Microsoft nắm vị thế cổ phần trị giá năm tỷ đô-la tại Anthropic; Anthropic, ngược lại, cam kết khoảng ba mươi tỷ đô-la chi tiêu tính toán Azure dài hạn. Số tiền đó dù sao cũng phải đi qua một dạng silicon nào đó. Câu hỏi còn để ngỏ, và là câu hỏi mà thỏa thuận này sẽ trả lời, là liệu Anthropic có đốt số tiền đó vào GPU Nvidia thuê từ Microsoft hay Microsoft có chuyển hướng được một phần đáng kể sang chip do chính mình thiết kế.

Maia 200 là bộ gia tốc suy luận thế hệ thứ hai của Microsoft. Linh kiện được TSMC sản xuất trên tiến trình 3 nano-mét và sử dụng bốn bộ gia tốc liên kết trên mỗi gói. Hãng định vị nó là silicon ưu tiên suy luận, tối ưu cho việc trả lời thay vì việc học. CEO Satya Nadella nói với các nhà đầu tư rằng chip mang lại “hơn 30 phần trăm số token trên mỗi đô-la cao hơn” so với silicon GPU mới nhất đã có trong đội Azure. Đó là tuyên bố về chi phí, không phải về năng lực; và trong suy luận, chi phí mới là thước đo quyết định liệu một con chip có tồn tại đủ lâu để có ý nghĩa hay không.

Với Anthropic, cuộc đàm phán Maia 200 nằm trong một khuôn mẫu. Phòng thí nghiệm đã dành cả năm qua xây dựng một chồng tính toán cố ý đa dạng: GPU Nvidia qua nhiều đám mây, chip AWS Trainium thông qua một cam kết nhiều năm với Amazon trị giá hơn một trăm tỷ đô-la, và TPU của Google cho một phần đường ống huấn luyện. Bổ sung silicon của Microsoft sẽ hoàn thiện bộ sưu tập này. Trên thực tế, Anthropic sẽ có kiến trúc tính toán đa dạng nhất theo nhà cung cấp trong số các phòng thí nghiệm tiên phong. Đây là biểu hiện vận hành của chiến lược mà Dario Amodei đã phát đi suốt nhiều tháng: tính toán, chứ không phải nhân tài, là ràng buộc trói chân phòng thí nghiệm.

Chưa có gì ngã ngũ. Cả hai bên đều mô tả cuộc đàm phán đang ở giai đoạn sớm, và Maia 200 chưa được mở cho khách hàng Azure bên ngoài dưới bất kỳ hình thức thương mại nào. Con số 30 phần trăm Microsoft nêu ra là chỉ số của nhà cung cấp trên một tải mà nhà cung cấp kiểm soát từ đầu đến cuối. Các benchmark độc lập so với thế hệ Hopper hay Blackwell hiện tại của Nvidia vẫn chưa xuất hiện công khai. Quang học chiến lược cũng khó chịu theo ít nhất một hướng: Microsoft là nhà tài trợ đơn lẻ lớn nhất của OpenAI, đối thủ trực tiếp gần nhất của Anthropic. Bán năng lực Maia đồng thời cho cả hai phòng thí nghiệm là một cấu hình Microsoft chưa từng thử nghiệm, và việc tách bạch hợp đồng để giữ uy tín không phải chuyện đơn giản.

Phần tiếp theo là thủ tục. Chưa có điều khoản thương mại nào lộ ra, chưa có ngày phổ cập Maia 200 ngoài các cơ sở của Microsoft được công bố, và không công ty nào xác nhận lịch trình. Tín hiệu cụ thể tiếp theo sẽ đến cùng báo cáo quý sắp tới của Microsoft, nơi bất kỳ khách hàng bên ngoài cam kết nào đáng kể đều buộc phải được công nhận. Cho đến lúc đó, vũ đạo tài chính giữa Redmond và San Francisco vẫn chạy trước cả con chip.

Thảo luận

Có 0 bình luận.