AI 安全初創公司 White Circle 獲行業領袖 1100 萬美元融資

(P1) 法國網絡安全初創公司 White Circle 已在種子輪融資中籌集 1100 萬美元，用於擴展其 AI 控制平台。這是為部署大語言模型的企業提供的一個新的安全層。此次融資背景是，企業正面臨著模型供應商內置通用安全過濾之外的風險，如數據洩露、幻覺和提示詞注入攻擊。

(P2) 「越獄只是問題的一部分，」White Circle 創始人兼首席執行官 Denis Shilov 告訴《財富》雜誌。「就像人們會有不當行為一樣，模型也會產生不當行為。我們實際上是在強制執行行為規範。」

(P3) 本輪投資獲得了多位 AI 行業領袖的參與，顯示出對公司方法的強烈信心。支持者包括 OpenAI 開發者體驗主管 Romain Huet、Anthropic 的 Durk Kingma、Mistral 聯合創始人 Guillaume Lample 以及 Hugging Face 聯合創始人 Thomas Wolf。該公司將利用這筆資金招聘人才、加速產品開發，並擴大在美國、英國和歐洲的客戶群。

(P4) 隨著公司從簡單的聊天機器人轉向能夠訪問文件或發放退款的自主 AI 代理，對專用控制層的需求變得更加緊迫。White Circle 的平台位於公司用戶和 AI 模型之間，即時監控所有輸入和輸出，以執行自定義策略——而模型供應商本身在完善這一功能方面動機各異。

這家總部位於巴黎的初創公司誕生於 Shilov 在 2024 年底的研究。當時他開發了一個通用的越獄提示詞，可以繞過所有領先 AI 模型的安全護欄。在他的發現獲 X 平台上走紅後，包括 Anthropic 在內的主要 AI 實驗室邀請他測試他們的模型，這使他確信，企業不僅需要更好的模型，更需要更好的控制機制。

White Circle 的軟件旨在捕捉各種模型失當行為。它可以阻止用戶生成惡意軟件的企圖，在模型產生幻覺並向客戶承諾未經授權的退款時發出警報，或者阻止 AI 代理洩露敏感財務數據。該平台已經處理了超過 10 億次 API 請求，並已被初創公司 Lovable 以及幾家金融科技和法律公司使用，不過具體的收入數據尚未披露。

為了增強其作為獨立仲裁者的信譽，White Circle 的研究部門發布了「KillBench」。這項研究對來自 OpenAI、Google 和 xAI 等供應商的 15 個 AI 模型進行了超過 100 萬次實驗。研究揭示了在高風險場景中出現的潛在偏見，凸顯了在普通使用中並不明顯的風險。

這筆投資是對圍繞 AI 行業增長的「鏟子和鎬」經濟的有功押注。來自 OpenAI、Anthropic 和 Mistral 等競爭性 AI 實驗室的高管參與其中，表明行業已達成廣泛共識：第三方執行層是企業 AI 技術棧的必要組成部分。這預示著一個專注於 AI 基礎設施和安全的新型關鍵細分市場正在投資者的關注下興起。

本文僅供參考，不構成投資建議。