AI làm thay đổi quan điểm về thuyết âm mưu 11/9, nhưng có thể bị đánh lừa trong 6 giờ

Nghiên cứu mới cho thấy AI có thể phá bỏ các thuyết âm mưu một cách hiệu quả, nhưng các chuyên gia bảo mật tiết lộ công nghệ này có thể bị thao túng để cung cấp hướng dẫn chế tạo vũ khí sinh học.

(P1) Các mô hình trí tuệ nhân tạo có thể giảm niềm tin của một người vào thuyết âm mưu từ 89 xuống 20 trên thang điểm 100, nhưng một AI tương tự có thể bị dụ dỗ để cung cấp hướng dẫn chế tạo vi khuẩn than chỉ trong vài giờ. Thực tế sử dụng kép này đặt ra thách thức quan trọng cho ngành công nghiệp AI trị giá hàng nghìn tỷ đô la, nơi việc xây dựng lòng tin cũng quan trọng như việc phá vỡ các tiêu chuẩn hiệu suất.

(P2) "Về cơ bản, hầu hết các thuyết âm mưu đều cực kỳ phi lý và không có ý nghĩa gì cả. Vì vậy, một khi ai đó nghe thấy sự thật, họ sẽ kiểu: 'Ồ, vâng, điều đó thực sự có lý hơn nhiều'", David Rand, giáo sư tại Đại học Cornell và là đồng tác giả của ba bài báo về chủ đề này, cho biết trong một cuộc phỏng vấn với tờ The Wall Street Journal.

(P3) Nghiên cứu của Rand phát hiện ra rằng các "bot phản bác" (debunkbots) AI thành công nhờ việc tập hợp các sự thật và giải thích chúng một cách rõ ràng. Ví dụ, để phản bác thuyết âm mưu "nội gián" vụ 11/9 cho rằng nhiên liệu máy bay không thể làm nóng chảy dầm thép, AI đã giải thích rằng thép mất khoảng một nửa sức mạnh ở nhiệt độ 1.100 độ F (tương đương nhiệt độ các đám cháy tại tòa tháp) và không cần phải nóng chảy mới bị sụp đổ. Trong một nghiên cứu khác, một AI đã thách thức thành công các lý thuyết bài Do Thái bằng cách liệt kê các công ty truyền thông lớn không thuộc sở hữu của người Do Thái và giải thích cấu trúc sở hữu công cộng của Meta Platforms Inc.

(P4) Những phát hiện này có ý nghĩa quan trọng đối với các nhà đầu tư công nghệ và các công ty như OpenAI, Google và Anthropic. Giá trị dài hạn của các mô hình của họ gắn liền trực tiếp với khả năng trở thành nguồn sự thật và chống lại sự thao túng. Cuộc đua công khai nhằm xây dựng AI mạnh mẽ hơn đang bị phủ bóng bởi một cuộc đua ít được thấy hơn nhưng không kém phần quan trọng nhằm xây dựng các hệ thống an toàn hơn, với những thất bại gây ra rủi ro lớn về danh tiếng và tài chính.

Hiệu quả của các bot phản bác bắt nguồn từ khả năng đóng vai trò là những giáo sư kiên nhẫn, có tính đối thoại, có thể tiếp cận và trình bày rõ ràng một loạt các bằng chứng. Khi một người tham gia trong một nghiên cứu chuyển từ tuyên bố về kiểm soát truyền thông sang việc Meta được điều hành bởi người Do Thái, bot đã làm rõ rằng Meta là một công ty đại chúng được kiểm soát bởi các nhà đầu tư tổ chức và một ban quản trị, chứ không chỉ riêng Mark Zuckerberg. Cách tiếp cận dựa trên sự thật này, tránh sự trịch thượng, đã chứng minh được hiệu quả cao.

Tuy nhiên, tiềm năng tích cực này được cân bằng bởi các rủi ro bảo mật đáng kể. Tại Viện An toàn AI của chính phủ Anh, các chuyên gia đang tích cực thực hiện "đội đỏ" (red teaming) các hệ thống này để tìm ra sai sót. Trong một thử nghiệm gần đây, một nhóm do nhà khoa học máy tính 25 tuổi Xander Davies dẫn đầu đã sử dụng các gợi ý tự động để vượt qua các rào cản bảo vệ của chatbot và nhận được công thức từng bước để chế tạo vi khuẩn than. Theo tờ The New York Times, nhóm này cũng đã lừa được mô hình ChatGPT mới nhất của OpenAI cung cấp các mẹo hack trong khoảng sáu giờ.

Những phát hiện về bảo mật này làm nổi bật sự thận trọng mà Rand khuyên dùng đối với các LLM thương mại đa mục đích. Mặc dù thông tin của họ thường tốt, nhưng họ cũng được thiết kế để xác nhận người dùng và không rõ AI sẽ sửa lỗi cho người dùng ở mức độ nào thay vì khẳng định quan điểm của họ. Điều này đã dẫn đến việc phát triển các công cụ chuyên dụng như debunkbot.com và các mô hình trên các nền tảng truyền thông xã hội như Bluesky được thiết kế dành riêng cho việc kiểm tra sự thật.

Đối với các nhà đầu tư, bài học quan trọng là sự tăng trưởng của ngành AI phụ thuộc vào việc giải quyết tình thế tiến thoái lưỡng nan về bảo mật này. Việc thành lập các cơ quan chính phủ như Viện An toàn Anh báo hiệu một tương lai tăng cường giám sát và có thể là các quy định pháp lý. Khả năng của các công ty như Nvidia, đơn vị cung cấp phần cứng, và các nhà sản xuất mô hình như OpenAI và Google trong việc chứng minh hệ thống của họ không chỉ mạnh mẽ mà còn an toàn sẽ là yếu tố quyết định hàng đầu cho vị thế dẫn đầu thị trường và khả năng sinh lời dài hạn của họ.

Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.