GPT-5.5 của OpenAI giải quyết câu đố bảo mật 12 giờ chỉ trong 10 phút

Mô hình GPT-5.5 mới của OpenAI có thể tự chủ thực hiện các cuộc tấn công mạng đa giai đoạn tinh vi và giải quyết các thách thức bảo mật phức tạp với tốc độ vượt xa các chuyên gia con người, theo một báo cáo mới của chính phủ. Những phát hiện từ Viện An toàn AI của Vương quốc Anh (AISI) đặt khả năng tấn công của GPT-5.5 ngang hàng với Claude Mythos của Anthropic, cho thấy những tiến bộ nhanh chóng, sâu rộng trong tiềm năng sử dụng AI vào mục đích xấu là một xu hướng chung, chứ không phải là một bước đột phá đơn lẻ.

"Nếu kỹ năng mạng tấn công đang nổi lên như một tác dụng phụ của những cải tiến rộng lớn hơn trong lập luận, mã hóa và hoàn thành nhiệm vụ tự chủ, thì những tiến bộ tiếp theo có thể đến liên tiếp nhanh chóng," Viện An toàn AI, một cơ quan nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã cảnh báo trong báo cáo của mình.

Báo cáo chi tiết cách GPT-5.5 tự chủ hoàn thành một cuộc tấn công mạng doanh nghiệp mô phỏng gồm 32 bước trong hai trên 10 lần thử. Thử nghiệm này, do SpecterOps thiết kế và được gọi là "The Last Ones", trước đây chỉ được hoàn thành bởi Claude Mythos Preview của Anthropic (trong ba trên 10 lần thử). Trong một thử nghiệm đáng chú ý hơn, GPT-5.5 đã giải được một câu đố kỹ thuật ngược mà một chuyên gia con người phải mất 12 giờ chỉ trong 10 phút 22 giây, với chi phí chỉ 1,73 USD phí sử dụng API. Trên một tập hợp rộng lớn hơn các nhiệm vụ an ninh mạng cấp chuyên gia, GPT-5.5 đạt tỷ lệ vượt qua 71,4%, cao hơn một chút so với 68,6% của Mythos Preview và vượt xa mức 52,4% của GPT-5.4.

Bước nhảy vọt về khả năng tấn công này tạo ra một cú sốc thị trường hai mặt: nó bộc lộ những lỗ hổng nghiêm trọng cho các doanh nghiệp, tạo ra triển vọng giảm giá cho các công ty có vị thế an ninh yếu, đồng thời đóng vai trò là chất xúc tác tăng giá mạnh mẽ cho lĩnh vực an ninh mạng. Sự phát triển này dự kiến sẽ thúc đẩy nhu cầu tăng vọt đối với các giải pháp phòng thủ do AI hỗ trợ và tăng cường áp lực pháp lý lên các nhà phát triển AI, một động lực thị trường được nhấn mạnh bởi việc chính phủ Anh công bố khoản tài trợ 90 triệu bảng Anh cho khả năng phục hồi mạng mới cùng với báo cáo.

Khoảng cách bất cân xứng giữa Tấn công và Phòng thủ ngày càng rộng

Những phát hiện của AISI xuất hiện trong bối cảnh thị trường vốn đã phải vật lộn với một cuộc chạy đua vũ trang lệch lạc về cấu trúc. Nghiên cứu từ Binance cho thấy các công cụ AI hiện có hiệu quả gấp đôi trong việc khai thác lỗ hổng hợp đồng thông minh so với việc phát hiện chúng. Báo cáo của công ty lưu ý rằng GPT-5.3-Codex đã đạt tỷ lệ thành công 72,2% trong chế độ "khai thác" trên chuẩn EVMbench, so với chỉ khoảng một nửa mức đó trong chế độ "phát hiện".

Sự bất đối xứng này được thúc đẩy bởi chi phí giảm mạnh cho những kẻ tấn công. Các khai thác do AI hỗ trợ hiện có giá trung bình khoảng 1,22 USD cho mỗi hợp đồng, một con số được dự báo sẽ giảm thêm 22% sau mỗi hai tháng, theo Binance Research. Trong khi hơn 80% nhà phát triển hiện sử dụng AI trong quy trình làm việc của họ, chưa đến 40% sử dụng nó để thử nghiệm bảo mật nâng cao, để lại một khoảng cách đáng kể cho các mối đe dọa tự động khai thác. Xu hướng này không giới hạn ở mã nguồn; các nhà phân tích của TRM Labs suy đoán rằng các nhóm hacker Bắc Triều Tiên đang sử dụng AI cho các kỹ thuật xã hội tinh vi, một sự thay đổi so với sự phụ thuộc truyền thống của họ vào các vectơ tấn công đơn giản hơn.

Thị trường chia rẽ về rủi ro AI

Sự xuất hiện nhanh chóng của những khả năng này đã làm dấy lên một cuộc tranh luận về việc tiết lộ và tiếp thị có trách nhiệm. CEO OpenAI Sam Altman gần đây đã chỉ trích cái mà ông gọi là "tiếp thị dựa trên nỗi sợ hãi", ám chỉ các đối thủ cạnh tranh thổi phồng sự nguy hiểm của các mô hình của họ để bán các giải pháp bảo mật. "Rõ ràng là một chiến lược tiếp thị khó tin khi nói rằng, 'Chúng tôi đã chế tạo một quả bom. Chúng tôi sắp ném nó xuống đầu bạn. Chúng tôi sẽ bán cho bạn một hầm trú ẩn với giá 100 triệu USD'," Altman nói trong một cuộc phỏng vấn podcast gần đây.

Để đối phó với mối đe dọa ngày càng tăng, cả OpenAI và Anthropic đều đang hạn chế quyền truy cập vào các mô hình mạnh nhất của họ. Anthropic đã giới hạn bản phát hành ban đầu của Mythos Preview cho các "đối tác ngành quan trọng", trong khi OpenAI đang triển khai GPT-5.5-Cyber, một phiên bản chuyên dụng, cho một danh sách các "nhà phòng thủ mạng quan trọng" đã được hiệu đính. Cách tiếp cận thận trọng này được đưa ra khi các nhà nghiên cứu tìm thấy một lỗi "vượt rào phổ quát" trong mô hình GPT-5.5 công khai giúp bỏ qua các rào cản an toàn của nó, một cuộc tấn công mà một đội đỏ (red team) đã mất sáu giờ để phát triển. Mặc dù OpenAI đã ban hành một bản vá kể từ đó, sự cố này làm nổi bật rủi ro lạm dụng dai dẳng, một mối lo ngại cho các nhà đầu tư khi 43% doanh nghiệp Vương quốc Anh báo cáo có lỗ hổng mạng trong năm qua.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.