這家總部位於巴黎的初創公司由一位曾通過單一提示詞攻破主流 AI 模型的研究員創立,現已籌集 1100 萬美元,旨在幫助企業控制其 AI 系統。
這家總部位於巴黎的初創公司由一位曾通過單一提示詞攻破主流 AI 模型的研究員創立,現已籌集 1100 萬美元,旨在幫助企業控制其 AI 系統。

(P1) 法國網絡安全初創公司 White Circle 已在種子輪融資中籌集 1100 萬美元,用於擴展其 AI 控制平台。這是為部署大語言模型的企業提供的一個新的安全層。此次融資背景是,企業正面臨著模型供應商內置通用安全過濾之外的風險,如數據洩露、幻覺和提示詞注入攻擊。
(P2) 「越獄只是問題的一部分,」White Circle 創始人兼首席執行官 Denis Shilov 告訴《財富》雜誌。「就像人們會有不當行為一樣,模型也會產生不當行為。我們實際上是在強制執行行為規範。」
(P3) 本輪投資獲得了多位 AI 行業領袖的參與,顯示出對公司方法的強烈信心。支持者包括 OpenAI 開發者體驗主管 Romain Huet、Anthropic 的 Durk Kingma、Mistral 聯合創始人 Guillaume Lample 以及 Hugging Face 聯合創始人 Thomas Wolf。該公司將利用這筆資金招聘人才、加速產品開發,並擴大在美國、英國和歐洲的客戶群。
(P4) 隨著公司從簡單的聊天機器人轉向能夠訪問文件或發放退款的自主 AI 代理,對專用控制層的需求變得更加緊迫。White Circle 的平台位於公司用戶和 AI 模型之間,即時監控所有輸入和輸出,以執行自定義策略——而模型供應商本身在完善這一功能方面動機各異。
這家總部位於巴黎的初創公司誕生於 Shilov 在 2024 年底的研究。當時他開發了一個通用的越獄提示詞,可以繞過所有領先 AI 模型的安全護欄。在他的發現獲 X 平台上走紅後,包括 Anthropic 在內的主要 AI 實驗室邀請他測試他們的模型,這使他確信,企業不僅需要更好的模型,更需要更好的控制機制。
White Circle 的軟件旨在捕捉各種模型失當行為。它可以阻止用戶生成惡意軟件的企圖,在模型產生幻覺並向客戶承諾未經授權的退款時發出警報,或者阻止 AI 代理洩露敏感財務數據。該平台已經處理了超過 10 億次 API 請求,並已被初創公司 Lovable 以及幾家金融科技和法律公司使用,不過具體的收入數據尚未披露。
為了增強其作為獨立仲裁者的信譽,White Circle 的研究部門發布了「KillBench」。這項研究對來自 OpenAI、Google 和 xAI 等供應商的 15 個 AI 模型進行了超過 100 萬次實驗。研究揭示了在高風險場景中出現的潛在偏見,凸顯了在普通使用中並不明顯的風險。
這筆投資是對圍繞 AI 行業增長的「鏟子和鎬」經濟的有功押注。來自 OpenAI、Anthropic 和 Mistral 等競爭性 AI 實驗室的高管參與其中,表明行業已達成廣泛共識:第三方執行層是企業 AI 技術棧的必要組成部分。這預示著一個專注於 AI 基礎設施和安全的新型關鍵細分市場正在投資者的關注下興起。
本文僅供參考,不構成投資建議。