Claude Mythos - mô hình AI định hình lại an ninh mạng thế giới

17:20 | 09/04/2026

Anthropic vừa giới thiệu Claude Mythos Preview, mô hình AI chưa từng được phát hành công khai, với năng lực phát hiện hàng nghìn lỗ hổng bảo mật nguy hiểm trên mọi hệ điều hành và trình duyệt lớn. Thông qua sáng kiến Project Glasswing, 11 tập đoàn công nghệ hàng đầu thế giới cùng hơn 40 tổ chức hạ tầng phần mềm sẽ sử dụng mô hình này cho công tác phòng thủ an ninh mạng toàn cầu, với tổng cam kết lên tới 100 triệu USD tín dụng sử dụng.

Mô hình AI vượt qua con người trong phát hiện lỗ hổng bảo mật

Theo công bố chính thức từ Anthropic, Claude Mythos Preview là mô hình AI chưa được phát hành công khai, và ngay từ giai đoạn thử nghiệm, Claude Mythos đã chứng minh năng lực vượt qua hầu hết chuyên gia bảo mật con người trong việc tìm kiếm và khai thác lỗ hổng phần mềm.

Trong vài tuần thử nghiệm, Claude Mythos đã phát hiện hàng nghìn lỗ hổng bảo mật nghiêm trọng, bao gồm các lỗ hổng tồn tại trên toàn bộ hệ điều hành lớn và trình duyệt web phổ biến hiện nay. Đáng chú ý, Claude Mythos phát hiện một lỗ hổng 16 năm tuổi trong FFmpeg, thư viện mã hóa và giải mã video được tích hợp trong vô số phần mềm trên thế giới, ngay tại một dòng mã mà các công cụ kiểm thử tự động đã duyệt qua 5 triệu lần mà không hề phát hiện ra.

Trên bộ đánh giá SWE-bench Verified, thước đo năng lực lập trình của các mô hình AI được giới nghiên cứu sử dụng rộng rãi, Claude Mythos đạt tỷ lệ giải quyết vấn đề chính xác 93,9%, trong khi Claude Opus 4.6 trước đó chỉ đạt 80,8%. Trên bộ đánh giá SWE-bench Pro với độ khó cao hơn, Mythos đạt 77,8% so với 53,4% của Opus 4.6, một khoảng cách phản ánh sự chênh lệch năng lực rõ ràng giữa hai thế hệ mô hình.

Dự án Glasswing, liên minh công nghệ bảo vệ hạ tầng phần mềm toàn cầu

Anthropic không phát hành Claude Mythos Preview cho công chúng mà thay vào đó triển khai thông qua Dự án Glasswing, một sáng kiến hợp tác quy tụ Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia và Palo Alto Networks. Đây là 11 tổ chức đầu tiên được tiếp cận Claude Mythos để thực hiện công tác phòng thủ an ninh mạng và chia sẻ kết quả nghiên cứu phục vụ toàn ngành.

Bên cạnh nhóm đối tác chiến lược kể trên, Anthropic cũng mở rộng quyền truy cập cho hơn 40 tổ chức khác tham gia xây dựng hoặc vận hành hạ tầng phần mềm quan trọng, để các đơn vị này sử dụng Mythos Preview quét và bảo mật cả hệ thống nội bộ lẫn các dự án mã nguồn mở. Toàn bộ chi phí sử dụng API trong khuôn khổ Project Glasswing được Anthropic cam kết chi trả thông qua gói tín dụng lên tới 100 triệu USD, đồng thời công ty dành thêm 4 triệu USD tài trợ trực tiếp cho các tổ chức bảo mật mã nguồn mở.

Claude Mythos - mô hình AI định hình lại an ninh mạng thế giới

Nguồn Anthropic

Anthony Grieco, Giám đốc An ninh và Tin cậy của Cisco, cho biết nhóm kỹ sư của hãng khi làm việc với Claude Mythos Preview đã chứng kiến khả năng phát hiện và khắc phục lỗ hổng bảo mật trên phần cứng và phần mềm với tốc độ và quy mô chưa từng có. Grieco nhận định đây là sự chuyển dịch sâu sắc, và cũng là tín hiệu rõ ràng cho thấy các phương pháp bảo mật hệ thống truyền thống không còn đủ để ứng phó với thực tế hiện tại.

Lý do Anthropic không công bố Claude Mythos Preview cho công chúng chính là mối lo ngại về sự phổ biến của năng lực này trong tay các chủ thể không cam kết sử dụng an toàn. Anthropic xác định AI đã đạt ngưỡng năng lực lập trình nơi các mô hình có thể vượt qua hầu hết chuyên gia con người trong việc tìm kiếm và khai thác lỗ hổng phần mềm và tốc độ phát triển AI hiện tại cho thấy năng lực đó sẽ phổ biến trong thời gian tới. Tác động với nền kinh tế, an toàn công cộng và an ninh quốc gia có thể rất nghiêm trọng nếu không có hành động phòng thủ kịp thời.

Anthropic xác nhận đang trao đổi với các quan chức Hoa Kỳ về Claude Mythos Preview và năng lực tấn công cũng như phòng thủ mạng của mô hình này. Tuy nhiên, mối quan hệ giữa Anthropic và chính phủ liên bang vẫn đang ở giai đoạn phức tạp, khi quân đội Hoa Kỳ gần đây xếp Anthropic vào danh sách rủi ro chuỗi cung ứng sau các bất đồng liên quan đến việc sử dụng Claude trong hoạt động quân sự và giám sát trong nước.

Trong những năm tới, Anthropic xác nhận mục tiêu cuối cùng là cho phép người dùng phổ thông triển khai các mô hình có năng lực tương đương Mythos trên phạm vi toàn cầu, song điều kiện tiên quyết là phải phát triển đủ các biện pháp bảo vệ an ninh mạng để phát hiện và chặn những đầu ra nguy hiểm nhất của mô hình. Một số biện pháp mới sẽ được công bố song song với lần ra mắt mô hình Claude Opus tiếp theo, dù thời điểm cụ thể chưa được tiết lộ.

Lần đầu AI tự tấn công mạng thay con người

Thông báo về Claude Mythos Preview xuất hiện một ngày sau khi Anthropic công bố doanh thu quy đổi hàng năm vượt 30 tỷ USD, tăng mạnh so với mức khoảng 9 tỷ USD vào cuối năm 2025. Tốc độ tăng trưởng thương mại vượt trội này cho thấy vị thế ngày càng vững chắc của Anthropic trong một thị trường AI ngày càng cạnh tranh.

Trên đường đua an ninh mạng AI, OpenAI là đối thủ lớn nhất của Anthropic, đã đi trước khi công bố chương trình Trusted Access for Cyber vào tháng 2 năm nay, hướng tới việc cung cấp quyền truy cập mô hình tiên tiến cho các đội ngũ an ninh mạng. Dự ánGlasswing của Anthropic hiện trở thành câu trả lời với phạm vi rộng hơn, cam kết tài chính lớn hơn và đặt vấn đề phòng thủ chủ động ở vị trí trung tâm của chiến lược phát triển mô hình.

Anthropic khẳng định không một đơn vị nào có thể giải quyết triệt để các thách thức an ninh mạng trong kỷ nguyên AI, và đó chính là lý do hình thành mô hình hợp tác đa bên trong Dự án Glasswing. Nhiệm vụ bảo vệ hạ tầng mạng toàn cầu có thể kéo dài nhiều năm, trong khi năng lực AI nhiều khả năng sẽ phát triển vượt bậc chỉ trong vài tháng tới, và đó là lý do Anthropic chọn hành động ngay hôm nay.

Công Trí