AI 할루시네이션에 1억 달러의 해결책 — 두 명의 전 마이크로소프트 연구원에게서 나왔다.
AI 할루시네이션에 1억 달러의 해결책 — 두 명의 전 마이크로소프트 연구원에게서 나왔다.

AI 할루시네이션에 1억 달러의 해결책 — 두 명의 전 마이크로소프트 연구원에게서 나왔다.
전 마이크로소프트 연구원 두 명이 창업한 AI 스타트업 Scaled Cognition이 기업용 AI 애플리케이션에서 할루시네이션을 제거하도록 설계된 모델 아키텍처를 상용화하기 위해 1억 달러 규모의 시리즈 A 투자를 유치했다.
"이러한 프론티어 모델들은 마치 정신분열증에 걸린 천재와 같습니다. 놀라운 답변을 만들어내지만, 같은 질문을 하면 완전히 다른 답변을 내놓고 심지어 그것조차 정확하지 않을 수 있습니다."라고 Scaled Cognition의 CEO 댄 로스는 말했다.
이 회사의 APT(Agentic Pretrained Transformer)는 기존의 토큰 스트림과 함께 프로그램 및 시스템 쿼리와 같은 구조화된 객체를 예측한다. 이는 언어적 그럴듯함을 최적화하면서 사실적 정확성을 검증하지 않는 대규모 언어 모델과의 차별점이다. 이 접근법은 가능한 쿼리 범위가 제한된 좁은 기업 도메인에서 가장 효과적이라고 로스는 설명했다.
7억 5천만 달러의 기업가치와 실리콘밸리에서 가장 저명한 AI 투자자 중 하나인 Khosla Ventures의 지원은 신뢰성에 초점을 맞춘 AI 인프라에 대한 수요 증가를 시사한다. 클라우드 기반 고객 경험 플랫폼 Genesys는 이미 Genesys Cloud 플랫폼 내에서 가상 에이전트 기능에 APT를 사용하고 있다.
OpenAI, Anthropic, Google의 대규모 언어 모델은 MMLU 및 HumanEval과 같은 벤치마크에서 90% 이상의 점수를 기록하며 일반 지식 작업 전반에 걸쳐 역량을 입증했다. 그러나 이러한 모델들은 확신에 차 있지만 사실적으로 틀린 답변을 내놓을 수 있다. 이는 처방 번호의 한 자리 숫자 오류가 법적 책임으로 이어질 수 있는 규제 산업에서는 용납될 수 없는 결함이다. "단 한 번의 오류도 재앙적인 결과를 초래할 수 있습니다."라고 로스는 처방 번호의 한 자리 숫자조차 할루시네이션할 수 없는 자동화된 헬스케어 에이전트를 설명하며 말했다.
Khosla Ventures의 창립 파트너 비노드 코슬라에 따르면, Scaled Cognition의 아키텍처는 신뢰성의 필요성에 따라 쿼리의 서로 다른 부분을 가장 적절한 시스템으로 라우팅하는 방식으로 작동한다. "이는 진정한 신뢰성이 필요하고 할루시네이션의 대상이 될 수 없는 시스템 부분을 위한 별도의 모델입니다."라고 그는 말했다.
AI가 생성한 출력물을 대규모로 검증하는 문제는 기업 도입의 핵심 장벽이다. 사람이 몇 줄의 코드는 쉽게 확인할 수 있지만, 수십만 줄의 AI 생성 코드를 검증하는 것은 사실상 불가능하다고 캘리포니아 대학교 버클리 캠퍼스의 컴퓨터 과학 교수이자 Databricks의 공동 창업자인 이온 스토이카는 말했다. "이는 프로그래밍 방식의 신뢰성을 기업 시스템에 절대적으로 필요한 요소로 만듭니다."라고 그는 강조했다.
Scaled Cognition은 이번 투자금을 연구팀 확장과 기업 배포 가속화에 사용할 계획이다. 캘리포니아주 마운틴뷰에 본사를 둔 이 스타트업은 로스와 UC 버클리의 AI 교수이자 자연어 처리 연구원인 댄 클라인이 공동 창업했다. 두 사람은 이전에 2018년 자신들의 스타트업 Semantic Machines를 마이크로소프트에 매각한 바 있다. 이 회사는 첫 번째 시장으로 고객 경험을 목표로 하고 있으며, 이 분야에서는 AI 기반 에이전트가 매일 수백만 건의 상호작용을 처리하고 정확성이 고객 유지 및 규제 준수에 직접적인 영향을 미친다. Genesys의 APT 도입은 이 기술의 상업적 실행 가능성에 대한 초기 증거를 제공한다.
투자자들에게 Scaled Cognition에 대한 베팅은 더 광범위한 테제를 반영한다: 기업들이 생성형 AI에 대한 실험 단계를 넘어서면서, 모델 출력을 신뢰할 수 있는 능력이 경쟁 우위가 된다는 것이다. 신뢰성 문제를 해결하는 기업은 Gartner가 2027년까지 3,000억 달러 지출을 예상하는 기업용 AI 시장에서 불균형적으로 큰 점유율을 차지할 수 있다. Scaled Cognition의 좁은 도메인 접근법은 범용 모델에 비해 총가용시장을 제한할 수 있지만, 기업들이 증명 가능한 정확한 출력에 대해 기꺼이 지불할 프리미엄이 이러한 제약을 상쇄할 수 있다.
본 문서는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.