Claude tìm 10.000 lỗ hổng nghiêm trọng trong một tháng — vá còn chưa kịp

Một mô hình chưa phát hành của Anthropic đã tìm thấy hơn mười ngàn lỗ hổng phần mềm ở mức nghiêm trọng cao và tới hạn chỉ trong một tháng, trải khắp mã nguồn của khoảng năm mươi tổ chức đối tác. Mô hình, được biết đến trong nội bộ là Claude Mythos Preview, được hướng vào các thư viện mã nguồn mở, các trình duyệt và hạ tầng đang chạy phần lớn internet hiện đại. Kết quả lật ngược một phương trình tồn tại nhiều thập kỷ trong an ninh phần mềm. Tìm ra lỗi không còn là phần khó nhất của công việc. Phần khó nhất bây giờ là vá chúng.

Chương trình mang tên Project Glasswing. Anthropic ra mắt nó khoảng một tháng trước khi công bố đợt số liệu đầu tiên này. Khoảng năm mươi tổ chức đối tác đã đồng ý cho mô hình quét mã sản xuất của chính họ. Cloudflare thả mô hình lên các hệ thống tới hạn và nhận về khoảng hai ngàn phát hiện, bốn trăm trong số đó được xếp loại cao hoặc tới hạn. Mozilla cho mô hình chạy trên Firefox và lôi ra 271 lỗi khác nhau trong bản phát hành lớn tiếp theo của trình duyệt, gấp hơn mười lần so với những gì chính đội này tạo ra ở phiên bản trước với Claude Opus 4.6, mô hình công khai.

Những con số đó có ý nghĩa gì còn tùy vào phần mềm bạn thực sự dùng. Mô hình phát hiện một lỗ hổng giả mạo chứng chỉ trong wolfSSL, một thư viện mật mã hiện diện bên trong hàng tỷ bộ định tuyến gia đình, trung tâm nhà thông minh và bộ điều khiển công nghiệp. Lỗ hổng đã có mã CVE, CVE-2026-5194, và bản vá đang được phát hành. Cũng đợt quét đó trên hơn một ngàn dự án mã nguồn mở đã sinh ra khoảng 6.202 sự cố ở mức cao hoặc tới hạn. Đây không phải những phát hiện học thuật trên các benchmark đồ chơi. Đây là lỗi trong mã thực đang xử lý các kết nối mã hóa của bạn, các tab trình duyệt của bạn và các máy ở đầu kia dây cáp.

Mythos Preview không phải một phiên bản Claude mà ai cũng có thể mua. Anthropic chọn không phát hành ra công chúng. Công ty lập luận rằng chính mô hình tìm ra lỗ hổng ở quy mô này, vào sai tay, sẽ trở thành một nhà máy sản xuất exploit ở quy mô công nghiệp. “Không công ty nào,” thông báo viết, “đã phát triển được các biện pháp bảo vệ đủ mạnh để ngăn việc lạm dụng các mô hình như vậy.” Hiện tại Mythos Preview sống bên trong một chương trình có kiểm soát, với các đối tác đã được kiểm tra và một kênh công bố lỗ hổng được phối hợp.

Mô hình đang tìm những loại lỗi gì? Lỗi an toàn bộ nhớ trong các thư viện C và C++, các lỗ hổng xử lý chứng chỉ giống như cái ở wolfSSL, lỗi logic trong các bản triển khai giao thức mạng và các lỗ hổng xác thực trong các dịch vụ được triển khai rộng. Đó chính là những hạng mục đã đứng sau hàng thập kỷ rò rỉ dữ liệu trong thực tế. Viện An ninh AI Vương quốc Anh cho biết Mythos Preview là mô hình đầu tiên mà họ thử nghiệm đã giải được trọn vẹn cả hai mô phỏng cyber range của họ, các môi trường được kiểm soát mô phỏng toàn bộ chuỗi tấn công. Công ty an ninh độc lập XBOW gọi mô hình này là “một bước nhảy đáng kể” so với công việc trước đó, với cái mà họ mô tả là “độ chính xác hoàn toàn chưa từng có”.

Câu hỏi tiếp theo, với bất kỳ ai đã làm việc với các bộ quét tự động, là có bao nhiêu phần trong số phát hiện này là thật. Các công ty an ninh độc lập đã xem lại 1.752 báo cáo được đánh giá là cao hoặc tới hạn. Khoảng 90,6 phần trăm, tức 1.587, được xác nhận là lỗ hổng hợp lệ. Đó là tín hiệu sạch hơn nhiều so với mức nhiễu thường thấy của fuzzing hay các công cụ dò theo mẫu, và Cloudflare cho biết tỷ lệ dương tính giả của mô hình, trong các thử nghiệm nội bộ, tốt hơn so với các thành viên red team là người thật. Nhưng nó vẫn có nghĩa là khoảng một trên mười cảnh báo là báo động giả. Ở quy mô này, đó là khoảng một ngàn báo cáo không phải lỗi nằm trong đống, mỗi cái vẫn cần một người đọc và loại bỏ.

Vấn đề khó hơn là chuyện gì xảy ra sau khi một lỗi thật được báo cáo. Vào thời điểm bản cập nhật đầu tiên này, chỉ 75 trong số 530 lỗ hổng cao hoặc tới hạn được báo cho người bảo trì là đã được vá. Bản vá trung bình mất khoảng hai tuần. Một số người bảo trì mã nguồn mở, theo tường thuật là quá tải, đã đề nghị Anthropic giảm tốc độ công bố. “Tiến bộ trong an ninh phần mềm trước đây bị giới hạn bởi tốc độ chúng ta có thể tìm ra lỗ hổng mới,” công ty viết. “Bây giờ nó bị giới hạn bởi tốc độ chúng ta có thể xác minh, công bố và vá khối lượng lỗ hổng lớn mà AI tìm ra.”

Với một người dùng bình thường, kết luận thực tế không hào nhoáng. Phần mềm bạn đang dùng hôm nay, có thể chính trình duyệt đang mở trang này, gần như chắc chắn chứa các lỗi nghiêm trọng mà một AI đã biết và con người chưa kịp sửa. Công bố phối hợp giả định bản vá đến trước thông báo công khai, và trật tự đó chỉ giữ khi các bản vá thực sự đến đúng hạn. Project Glasswing hiện neo ở Mỹ và Anh. Cloudflare, Mozilla, Viện An ninh AI Vương quốc Anh và XBOW là những bên được nêu tên. Không tồn tại chương trình điều phối công bố tương đương ở phần lớn các quốc gia khác. Liệu các lỗi mô hình tìm thấy trong các ngăn xếp phần mềm tại Việt Nam, Brazil, Ấn Độ, Nhật Bản hay Hàn Quốc có được xử lý với cùng mức cấp bách hay không, vẫn là câu hỏi mở.

Anthropic nói Project Glasswing đang mở rộng sang thêm các đối tác. Bản thân mô hình Mythos Preview vẫn nằm ngoài thị trường, và công ty chưa đưa ra lịch trình phát hành công khai; bất kỳ triển khai rộng hơn nào, theo đánh giá hiện tại của chính họ, sẽ đòi hỏi những biện pháp bảo vệ chưa tồn tại. Một bản cập nhật thứ hai dự kiến công bố vào cuối năm 2026. Chỉ số cần theo dõi không phải là một AI có thể tìm ra bao nhiêu lỗi. Mà là con người ở đầu bên kia đã kịp sửa được bao nhiêu trong số đó.

Thẻ: tech-en1, Anthropic, Claude, AI security, Project Glasswing, Cloudflare