Sức mạnh của Mythos

Mythos là một từ tiếng Hy Lạp cổ (μῦθος - mythos), có nghĩa là truyền thuyết, huyền thoại.

Anthropic hôm thứ Ba (7/4/2026) đã phát hành bản xem trước của mô hình tiên tiến nhất mới mang tên Mythos. Công ty cho biết mô hình này sẽ được sử dụng bởi một nhóm nhỏ các tổ chức đối tác để phục vụ công việc an ninh mạng. Trong một bản ghi nhớ bị rò rỉ trước đó, startup AI này đã gọi Mythos là một trong những mô hình “mạnh mẽ nhất” mà họ từng phát triển. Đây không phải là model chuyên biệt an ninh mạng, nhưng khả năng lập trình và suy luận của nó đã cho phép nó làm những việc mà trước đây chỉ các hacker hàng đầu mới làm được.

Quyền lực của mô hình tiên tiến nhất

Đây là dấu hiệu cho thấy cục diện quyền lực xung quanh AI đã thay đổi căn bản: Anthropic đã giới hạn mô hình AI mạnh nhất từ trước đến nay của mình chỉ cho một nhóm nhỏ các thực thể tư nhân. Việc ra mắt hạn chế của mô hình là một phần trong sáng kiến an ninh mới mang tên Project Glasswing. Theo đó, 40 tổ chức đối tác sẽ triển khai mô hình này nhằm mục đích “công việc an ninh phòng thủ” và bảo vệ các phần mềm quan trọng, Anthropic cho biết. Mặc dù mô hình không được huấn luyện chuyên biệt cho lĩnh vực an ninh mạng, nhưng nó sẽ được sử dụng để quét các hệ thống phần mềm nội bộ (first-party) cũng như phần mềm mã nguồn mở nhằm tìm kiếm lỗ hổng mã, công ty nói.

Anthropic tuyên bố rằng trong vài tuần qua, Mythos đã phát hiện “hàng nghìn lỗ hổng zero-day, nhiều trong số đó ở mức nghiêm trọng”. Công ty bổ sung rằng nhiều lỗ hổng này đã tồn tại từ một đến hai thập kỷ trước. Trong đó có cả một lỗ hổng tồn tại 27 năm trong một trong những hệ điều hành an toàn nhất thế giới.

Zero-day: những lỗ hổng trước đây chưa từng được biết đến.

Một lỗ hổng trong hệ điều hành OpenBSD đã làm cho nó có thể làm sập bất kỳ máy chủ OpenBSD nào phản hồi qua TCP, có khả năng tắt các máy chủ của công ty, chính phủ và internet. Nó đã không được phát hiện trong 27 năm trước khi mô hình tìm thấy nó (trong số các lỗ hổng OpenBSD khác). Bây giờ nó đã được vá.

Claude Mythos Preview cũng phát hiện ra một chuỗi lỗi trong nhân Linux cho phép nó đạt được quyền truy cập root và kiểm soát hệ thống. Nó cũng đã được vá.

Mythos là mô hình đa năng cho hệ thống Claude AI của Anthropic, với khả năng lập trình agent (agentic coding) và suy luận mạnh mẽ mà công ty khẳng định. Các mô hình frontier của Anthropic được coi là những mô hình tinh vi và có hiệu suất cao nhất, được thiết kế cho các nhiệm vụ phức tạp hơn, bao gồm xây dựng agent và lập trình. Mô hình này cũng vượt xa các benchmark vốn được dùng để đánh giá hiệu suất của những mô hình mạnh nhất cho đến nay - gây sốc cho các nhà quan sát và nhà nghiên cứu AI, những người vốn đã dự đoán Mythos sẽ là một bước ngoặt trong lĩnh vực an ninh mạng. Đây là minh chứng rõ ràng rằng AI đang đạt đến mức "siêu con người" ở một số nhiệm vụ kỹ thuật. Khả năng dual-use (có thể dùng cả phòng thủ lẫn tấn công) cực kỳ cao.

Các tổ chức đối tác đang xem trước Mythos trong khuôn khổ Project Glasswing bao gồm: Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft và Palo Alto Networks. Là một phần của sáng kiến này, các đối tác cuối cùng sẽ chia sẻ những gì họ học được từ việc sử dụng mô hình để phần còn lại của ngành công nghệ có thể hưởng lợi. Anthropic cho biết bản xem trước sẽ không được cung cấp rộng rãi, tuy nhiên sẽ có tổng cộng 40 tổ chức được cấp quyền truy cập vào bản preview Mythos ngoài quan hệ đối tác.

“Điều này càng nhấn mạnh lý do tại sao việc chúng ta thắng cuộc đua AI lại quan trọng đến vậy, để chúng ta luôn dẫn trước Trung Quốc,” Dmitri Alperovitch, đồng sáng lập và Chủ tịch Silverado Policy Accelerator kiêm thành viên WP Intelligence Global Security Council, phát biểu. “Bởi vì hãy tưởng tượng nếu Trung Quốc có một mô hình như thế này; họ sẽ không sử dụng nó cho mục đích phòng thủ. Họ sẽ dùng nó để tấn công chúng ta, xâm nhập vào hạ tầng quan trọng, hệ thống an ninh quốc gia và sức mạnh kinh tế của chúng ta.”

Chính vì mô hình này có thể gây thiệt hại nghiêm trọng cho hạ tầng kỹ thuật số toàn cầu nếu rơi vào tay kẻ xấu, Anthropic đã quyết định không công khai mô hình, ngoại trừ một nhóm chọn lọc các công ty đang vận hành phần mềm quan trọng nhất thế giới.

Sự phát triển này báo hiệu một sự chuyển dịch sâu sắc trong cách thế giới tương tác với AI.

Anthropic đã giương cao “cờ đỏ” về năng lực, báo hiệu rủi ro lạm dụng ngay lập tức. Bằng việc hạn chế truy cập vào mô hình mạnh mẽ này, Anthropic không chỉ đưa ra quyết định về an toàn mà còn là quyết định có ảnh hưởng đến an ninh quốc gia và địa chính trị.

Trong thế giới này, chỉ một nhóm chọn lọc gồm các công ty tư nhân hoặc chính phủ mới có thể sử dụng và định hình các tiêu chuẩn xung quanh những mô hình AI tiên tiến với năng lực chưa từng có. Và có thể chúng ta sẽ không bao giờ quay trở lại.

“Tôi nghĩ mô hình phát hành kiểu này mà chúng ta đang thấy sẽ tồn tại lâu dài,” Caleb Withers, cộng tác viên nghiên cứu tại Chương trình Công nghệ và An ninh Quốc gia thuộc Trung tâm An ninh Mới của Mỹ (Center for a New American Security), cho biết trong một cuộc phỏng vấn.

Các cường quốc quốc gia trước đây vẫn giả định rằng “chúng ta sẽ luôn có thể sử dụng rộng rãi những mô hình mới nhất và tốt nhất”. Withers nhận định: “Tôi nghĩ giả định đó đang lung lay”.

Về phần mình, Alperovitch không đồng tình. Ông cho rằng dù không thể dự đoán chính xác năng lực frontier của các mô hình AI tương lai, nhưng có lẽ sẽ mất 12 đến 18 tháng để tìm ra tất cả “các lỗ hổng dễ tìm" trong các lỗ hổng mạng mới. Sau khoảng thời gian đó, “ngưỡng phát hiện sẽ trở lại rất cao”.

“Đây rất có thể là một cửa sổ thời gian không kéo dài,” Alperovitch nói. “Tôi nghĩ điều này có lẽ chỉ đặc thù với [Mythos].”

Ai kiểm soát chính sách AI?

Anthropic quyết định không công khai mà chỉ cho khoảng 40 tổ chức lớn truy cập qua Project Glasswing là một quyết định trách nhiệm và hợp lý. Trong ngắn hạn (6-18 tháng), Project Glasswing sẽ giúp vá hàng loạt lỗ hổng nghiêm trọng trong hạ tầng quan trọng. Nhiều công ty lớn sẽ “củng cố” hệ thống của mình trước khi các model tương tự ra đời và lan rộng. Cán cân tạm thời nghiêng về phòng thủ. Trong trung và dài hạn, các lab khác (OpenAI, Google, xAI, Trung Quốc…) chắc chắn sẽ đuổi kịp hoặc vượt qua. Khi model tương đương trở nên rẻ hơn và dễ tiếp cận hơn, tấn công sẽ dễ dàng hơn phòng thủ rất nhiều. Bruce Schneier và nhiều chuyên gia đã cảnh báo: AI tìm lỗ hổng nhanh hơn vá lỗi rất nhiều vì vá lỗi đòi hỏi kiểm tra toàn diện, tương thích ngược.

Anthropic cũng cho biết họ đang có “các cuộc thảo luận đang diễn ra” với quan chức liên bang về việc sử dụng Mythos. Tuy nhiên, có thể dễ dàng hình dung rằng những cuộc thảo luận này đang phức tạp hóa do Anthropic và chính quyền Trump hiện đang vướng vào một cuộc chiến pháp lý, sau khi Lầu Năm Góc gắn mác Anthropic là “rủi ro chuỗi cung ứng” vì công ty từ chối cho phép nhắm mục tiêu tự động hoặc giám sát công dân Mỹ.

Việc tiếp cận Mythos có thể trao cho các tác nhân nhỏ và những kẻ khủng bố năng lực bất đối xứng, nhưng phản ứng chính sách của Anthropic đã chuyển giao quyền lực - ít nhất là tạm thời - vào tay các công ty Mỹ, và cả chính phủ Mỹ nếu họ quyết định hòa giải với công ty và rút lại quyết định coi Anthropic là “rủi ro chuỗi cung ứng”.

“Việc Anthropic hiện đang bị gắn mác rủi ro chuỗi cung ứng là không hay ho,” Withers nói. “Điều đó có vẻ sẽ ảnh hưởng đến khả năng của các cơ quan tình báo và Cục An ninh Cơ sở hạ tầng và An ninh mạng (CISA) trong việc xem mô hình này có thể làm gì.”

Nhưng sự phát triển của Mythos cũng làm gia tăng căng thẳng vốn là nguyên nhân gây ra cuộc xung đột giữa Anthropic và Bộ Quốc phòng ngay từ đầu. Nếu không có mô hình nào thậm chí tiếp cận được năng lực của Mythos, điều đó có nghĩa là một công ty tư nhân - chứ không phải chính phủ Mỹ - đang tạo ra chính sách cho việc sử dụng công cụ mạng mạnh nhất thế giới.

Thông tin về Mythos ban đầu bị rò rỉ trong một sự cố an ninh dữ liệu được Fortune đưa tin vào tháng trước. Một bản nháp blog về mô hình (lúc đó có tên “Capybara”) đã bị để lại trong kho tài liệu không được bảo mật công khai trên một data lake có thể kiểm tra. Anthropic sau đó quy lỗi rò rỉ này là “lỗi con người”. Các nhà nghiên cứu an ninh là những người đầu tiên phát hiện. Tài liệu bị rò rỉ viết: “‘Capybara’ là tên mới cho một cấp độ mô hình mới: lớn hơn và thông minh hơn các mô hình Opus của chúng tôi - vốn là những mô hình mạnh nhất cho đến nay”, và sau đó khẳng định đây là “mô hình AI mạnh nhất mà chúng tôi từng phát triển”.

Trong bản rò rỉ, Anthropic tuyên bố mô hình mới vượt trội hơn hẳn ở các lĩnh vực (như “lập trình phần mềm, suy luận học thuật và an ninh mạng”) so với các mô hình công khai hiện tại. Họ cũng cảnh báo rằng nếu bị các tác nhân xấu vũ khí hóa để tìm và khai thác lỗ hổng (thay vì sửa chữa như cách Mythos được triển khai), mô hình này có thể trở thành mối đe dọa an ninh mạng.

Tháng trước, công ty đã vô tình tiết lộ gần 2.000 tệp mã nguồn và hơn nửa triệu dòng code do sai sót trong việc phát hành phiên bản 2.1.88 của gói phần mềm Claude Code. Sau đó, Anthropic còn vô tình khiến hàng nghìn kho lưu trữ code trên GitHub bị gỡ bỏ khi cố gắng dọn dẹp hậu quả.

Sự tồn tại của Mythos đặt ra những mối đe dọa nghiêm trọng đối với hạ tầng an ninh mạng bảo vệ dữ liệu nhạy cảm và hệ thống tài chính chi phối khả năng thanh toán của ngân hàng. Câu hỏi đặt ra là: Liệu một bên phòng thủ sử dụng Mythos để chủ động tìm lỗ hổng có thể chống lại hiệu quả một bên tấn công đang chạy các cuộc tấn công tự động 24/7 vào hạ tầng mạng hay không?

Rõ ràng, cán cân quyền lực dường như đã nghiêng về phía bên tấn công.

“Tôi không mấy tin tưởng rằng các hệ thống AI sẽ vá lỗ hổng dễ dàng bằng cách tìm ra chúng, vì việc vá lỗi thường đòi hỏi kiểm tra và hiểu biết toàn diện hơn,” nhà nghiên cứu an ninh mạng Bruce Schneier viết trong một bài bình luận mới trên tạp chí CSO.

Mourad Yesayan, người dẫn dắt đầu tư của quỹ cyber thuộc công ty vốn mạo hiểm Paladin Capital Group, cho biết Anthropic cuối cùng sẽ cần cung cấp một lộ trình để hướng dẫn cho các nhà cung cấp phần mềm bên ngoài Project Glasswing.

“Nếu tôi là một doanh nghiệp lớn và sử dụng hàng trăm sản phẩm phần mềm, đồng thời có lẽ cũng là khách hàng của Anthropic, tôi chắc chắn sẽ hỏi về lộ trình của họ để đảm bảo rằng các nhà cung cấp phần mềm khác của tôi… họ sẽ làm thế nào để không bị bỏ lại phía sau?” Yesayan nói.

“Bạn cứ tin đi, họ sẽ thử, và nếu không thành công với Mythos, họ cuối cùng cũng sẽ làm được,” Ball, cựu cố vấn cấp cao về chính sách AI trong chính quyền Tổng thống Donald Trump, đã chỉ ra trên X. Điều này có nghĩa là các phòng thí nghiệm tiên tiến sẽ cần tăng cường an ninh - và chính phủ Mỹ có lợi ích trong việc ngăn chặn sự xâm nhập vào các phòng thí nghiệm tiên tiến do Anthropic, OpenAI và Google vận hành.

Chúng ta đang bước vào kỷ nguyên AI-native cybersecurity, nơi mọi phần mềm đều phải được thiết kế lại với giả định rằng AI attacker luôn tồn tại 24/7. Có thể sẽ xuất hiện “immune systems” dựa trên AI cho code, nhưng cũng sẽ có vũ khí AI tấn công tự động.

Mỹ đang cố giữ lợi thế, nhưng ngày Trung Quốc hoặc Nga có được công nghệ tương tự chắc cũng không còn xa. Các công ty tư nhân lớn (Big Tech) đang nắm quyền kiểm soát công cụ mạnh nhất thay vì chính phủ - điều này tạo ra vấn đề chính sách và an ninh quốc gia. Nếu xảy ra các cuộc tấn công lớn do AI hỗ trợ, lòng tin vào công nghệ số có thể sụp đổ tạm thời.

Mythos là dấu hiệu báo trước cho một kỷ nguyên mới - giống như việc phát minh ra súng vậy. Nó không phải là “kết thúc”, nhưng buộc cả ngành phải thay đổi cách tiếp cận an ninh mạng một cách căn bản. Anthropic đang cố dùng nó để “mua thời gian” cho nhân loại, và đó là cách tiếp cận cẩn trọng đáng khen.

- Tổng hợp-

Tìm kiếm Blog này

Gone with the wind