Baseten, 오픈소스 AI 모델에 150억 달러 베팅…기업 AI 지출 패러다임 전환 신호

Baseten의 150억 달러 자금 조달은 기업 AI 지출이 프리미엄 폐쇄형 모델에서 저렴한 오픈소스 대안으로 전환되고 있음을 시사한다.

오픈소스 모델을 위한 추론 인프라를 구축하는 AI 스타트업 Baseten이 최대 130억 달러의 기업가치로 15억 달러 규모의 자금 조달을 마무리하고 있다. 이는 기업들이 프리미엄 폐쇄형 모델에서 더 저렴한 대안으로 AI 지출을 전환할 것이라는 최신 베팅이다.

"오픈소스 모델이 매우, 매우 좋아지고 있습니다,"라고 Baseten의 공동 창업자이자 최고경영자(CEO)인 Tuhin Srivastava는 말했다. "그리고 오픈소스가 발전함에 따라 우리도 함께 성장하고 있습니다."

이번 라운드는 듀얼 티어 구조로 진행되며, 일부 투자자는 110억 달러, 다른 투자자는 130억 달러의 기업가치로 참여한다고 회사 측은 밝혔다. Altimeter Capital, Conviction, Spark Capital, Sands Capital, Wellington Management가 공동으로 투자를 주도했으며, 이는 Wellington의 첫 AI 추론 분야 진출이다. Baseten의 소프트웨어 레이어는 20개 클라우드 제공업체의 컴퓨팅 역량 위에 위치하여, 고객이 하드웨어를 관리하지 않고도 오픈소스 모델을 실행, 최적화 및 학습시킬 수 있는 인프라를 제공한다.

이 베팅은 더 광범위한 시장 변화를 반영한다. 독립적인 테스트에 따르면, 오픈소스와 폐쇄형 모델 간의 성능 격차는 2023년 2년 수준에서 현재는 주요 엔지니어링 벤치마크에서 불과 몇 주로 좁혀졌다. 1조 6000억 개의 파라미터를 가진 오픈 모델인 DeepSeek-V4는 출력 토큰 100만 개당 약 87센트로, OpenAI 및 Anthropic의 최고 수준 가격의 약 30분의 1 수준이다. 기업들이 AI 지출의 일부라도 오픈소스 대안으로 전환한다면, 2000억 달러가 넘는 데이터센터 건설을 뒷받침하는 매출 전망은 심각한 압박을 받을 수 있다.

추론 레이어가 비즈니스가 되다

Baseten은 AI 모델이 질의에 응답하기 위해 컴퓨팅 파워를 사용하는 과정인 추론(인퍼런스) 붐에 편승하는 성장하는 스타트업 생태계의 일부다. 추론 전용 칩을 설계한 Cerebras는 5월에 상장해 현재 약 500억 달러의 시가총액을 기록하고 있다. Fireworks AI는 10월에 40억 달러의 기업가치로 자금을 조달했으며, 자율 코딩 에이전트를 구축하는 스타트업 Factory는 4월에 15억 달러에 도달했다.

경제성은 채택을 가속화하고 있다. 한 Baseten 고객은 Srivastava에게 특정 작업을 폐쇄형 모델에 필요한 비용의 30%로 수행했다고 말했다. 대부분의 Baseten 고객은 오픈 모델과 폐쇄 모델을 혼합하여 사용하며, 최고의 성능이 절대적으로 필요한 작업에만 최첨단 시스템을 사용하고 일상적인 작업 부하는 저렴한 대안으로 처리한다.

"오픈소스 모델은 항상 최첨단 모델보다 몇 달 뒤쳐져 있지만, 많은 사용 사례를 처리할 수 있고 최고 수준의 토큰 사용량 일부를 절약할 수 있습니다,"라고 Wellington Management의 투자자 Oz Nur는 말했다.

중국의 오픈소스 공세

현재 가장 인기 있는 오픈소스 모델은 중국 연구소에서 나오고 있다. DeepSeek의 V4 시리즈와 Z.ai의 GLM-5.2는 엔지니어링 작업에서 미국 선도 모델과 맞먹거나 능가하는 벤치마크 점수를 기록했다. GLM-5.2는 Terminal-Bench 2.1에서 81.0점을 기록했으며, 이는 몇 주 전 출시된 이전 버전의 62점에서 상승한 수치다. 이 모델은 100만 토큰의 컨텍스트 윈도우를 제공하며, 토큰당 가격은 미국 선도 폐쇄형 모델의 약 6분의 1 수준이다.

미국 기업들은 따라잡기 위해 노력하고 있다. Nvidia는 최근 오픈소스 모델 제품군인 Nemotron을 출시했으며, Meta는 Llama 시리즈 개발을 계속하고 있다. 그러나 중국 연구소들은 더 빠르게 반복하고 있다 — GLM은 4개월 만에 버전 5.0에서 5.2로 업그레이드했으며, 각 릴리스는 자국산 실리콘에서 학습되었다.

투자자들의 계산

투자자들에게 계산은 간단하다. GPT-4 수준의 출력 비용은 2022년 말 토큰 100만 개당 약 20달러에서 현재 약 40센트로 거의 1000분의 1 수준으로 하락했다. 이러한 디플레이션은 올해 메모리 부족으로 인해 일시 중단되었지만, 새로운 팹 생산 능력이 가동되면 추세가 재개될 수 있다. 한편, 128GB 통합 메모리를 탑재한 Nvidia의 4,700달러 데스크톱 머신 DGX Spark는 이제 최대 2000억 개의 파라미터 모델을 로컬에서 실행할 수 있다.

최첨단 수준의 오픈 모델이 저렴한 로컬 하드웨어에서 실행된다면, 데이터센터 GPU의 5년 감가상각 일정을 정당화하는 중앙집중식 추론 수요는 예상보다 느리게 성장할 수 있다. Michael Burry는 업계 전반에 걸쳐 2028년까지 약 1,760억 달러의 과소계상된 감가상각비를 지적했으며, 2026년으로 계획된 미국 데이터센터 프로젝트의 약 절반은 이미 지연 또는 취소에 직면해 있다.

Baseten의 고객에는 Cursor, Mercor 및 OpenEvidence가 포함된다. The Information은 이번 자금 조달에 대해 먼저 보도한 바 있다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.