Công nghệ

LongCat 2.0 của Meituan đánh bại GPT-5.5 về lập trình — không cần chip Nvidia

Susan Hill

LongCat 2.0 có 1,6 nghìn tỷ tham số, xử lý ngữ cảnh lên đến một triệu token và vừa vượt qua GPT-5.5 của OpenAI trên bộ kiểm tra hàng đầu về kỹ thuật phần mềm trong thực tế. Mô hình được xây dựng bởi Meituan — công ty mà hầu hết mọi người bên ngoài Trung Quốc biết đến, nếu biết, là ứng dụng giao đồ ăn.

Mô hình đạt 59,5 điểm trên SWE-bench Pro so với 58,6 của GPT-5.5. Khoảng cách có vẻ nhỏ, nhưng cách hệ thống được xây dựng mới là điều đáng chú ý. Meituan huấn luyện LongCat 2.0 trên hơn 50.000 bộ tăng tốc AI nội địa Trung Quốc — không có phần cứng Nvidia mà Trung Quốc không thể nhập khẩu với số lượng lớn từ năm 2022. Nhà sản xuất chip chưa được xác nhận chính thức, nhưng cộng đồng kỹ thuật chỉ đến Huawei Ascend 910B. Nếu đúng, đây sẽ là lần đầu tiên mô hình được huấn luyện trên chip Huawei đạt hiệu suất hàng đầu trong các bộ kiểm tra công khai có thể xác minh.

LongCat 2.0 sử dụng kiến trúc Mixture-of-Experts: chỉ từ 33 đến 56 tỷ tham số được kích hoạt mỗi truy vấn, giữ cho suy luận nhanh mà không đòi hỏi phần cứng cao cấp. Cửa sổ ngữ cảnh một triệu token cho phép đọc toàn bộ codebase trong một phiên. Trên SWE-bench Multilingual đạt 77,3; trên Terminal-Bench đạt 70,8.

Trước khi công bố chính thức, mô hình hoạt động âm thầm trên OpenRouter với tên “Owl Alpha” khoảng hai tháng. Các lập trình viên sử dụng nó nhận thấy khả năng lập trình đặc biệt nhưng không biết nguồn gốc. Meituan xác nhận sau khi ra mắt rằng Owl Alpha chính là LongCat 2.0 ở giai đoạn đánh giá sớm.

Giấy phép MIT chỉ kể một phần câu chuyện. Dù là một trong những giấy phép mở và thân thiện thương mại nhất, trọng số mô hình vẫn chưa được phát hành. GitHub và Hugging Face đều ghi “sắp ra mắt”. Hiện tại LongCat 2.0 chỉ có thể truy cập qua API được lưu trữ — chưa thể tải xuống, tinh chỉnh hay chạy cục bộ.

Meituan xử lý hơn 50 triệu đơn hàng thực phẩm mỗi ngày và âm thầm xây dựng mô hình ngôn ngữ nội bộ tên Zhichi trước khi phát triển bên ngoài. LongCat 2.0 là mô hình công khai đầu tiên và, theo kết quả kiểm tra, là một trong những hệ thống lập trình mạnh nhất theo giấy phép mở.

Khi trọng số được phát hành, LongCat 2.0 sẽ cạnh tranh trực tiếp với Llama 4.1 của Meta và DeepSeek-V4 Pro. Câu hỏi về loại chip nội địa đã tạo ra kết quả này sẽ có ý nghĩa vượt xa cộng đồng AI.

Thẻ: , , , , ,

Thảo luận

Có 0 bình luận.