핵심 요약:
- 포춘 500대 기업의 직원당 AI 비용이 월 7,500달러에 달해 광범위한 사용 제한 촉발
- 마이크로소프트, 코파일럿 코워크를 위해 Anthropic의 플래그십 모델 대비 57배 저렴한 DeepSeek V4 검토 중
- 마이크로소프트, Databricks, Nvidia가 투자한 Factory의 게이트웨이 도구, AI 비용 통제를 위한 새로운 인프라 계층으로 부상
핵심 요약:

포춘 500대 기업 내 무제한 AI 토큰 소비 시대가 막을 내렸다. 엄격한 예산, 사용량 제한, 더 저렴한 모델을 향한 경쟁으로 대체되고 있으며, 직원당 월 AI 비용은 7,500달러에 이르렀다.
AT&T는 직원들의 마이크로소프트 GitHub Copilot 접근을 제한했다. 메타는 Anthropic 및 기타 AI 서비스에 대한 지출을 강화했다. 우버는 4월까지 2026년도 AI 코딩 예산을 전액 소진했고, 직원당 도구별 월 사용 한도를 1,500달러로 설정했다. 월마트는 내부 AI 에이전트에 제한을 두었다. 아마존은 직원들의 AI 사용량을 순위화하던 내부 리더보드를 폐지했다 — 직원들이 순위를 올리기 위해 컴퓨팅 자원을 과도하게 소비하고 있다는 사실이 적발된 후다.
관계자들에 따르면, '토큰맥싱(tokenmaxxing)' — AI 토큰 소비를 극대화하는 관행 — 에서 '토큰미니마이징(tokenminimizing)'으로의 전환이 생성형 AI의 대규모 기업 사용자들 사이에서 확산되고 있다. AI 집약도가 가장 높은 기업들의 직원당 월 AI 비용은 7,500달러에 도달했으며, 이는 최고재무책임자(CFO)들의 개입을 불러일으켰다고 The Information이 보도했다.
"기업들은 에이전틱 AI 워크플로가 정액제 가격 체계에서 확장되지 않는다는 사실을 깨닫고 있습니다."라고 에드젠(Edgen)의 기업 AI 애널리스트 알렉스 응우옌은 말했다. "단일 AI 에이전트가 하나의 작업을 완료하기 위해 50번의 모델 호출을 연결할 수 있다면, 기업 규모에서는 수학이 작동하지 않습니다."
직원당 7,500달러의 수학적 문제
이 구조적 변화는 에이전틱 AI 도구의 부상에서 비롯된다. 이 도구는 이메일, 스프레드시트 및 메시징 앱 전반에서 복잡한 작업을 완료하기 위해 여러 모델 호출을 자율적으로 연결하는 소프트웨어다. 수동 챗봇 쿼리와 달리, 이러한 에이전트는 예측하거나 제한하기 어려운 방식으로 토큰을 폭발적으로 소비한다.
마이크로소프트의 내부 검토 데이터에 따르면, 일부 엔지니어들은 Claude Code만으로 월 500~2,000달러의 토큰 수수료를 지출하고 있는 것으로 나타났다. 기업 AI 상호작용 비용은 2023년 이후 30배 급증했으며, 골드만삭스는 에이전틱 워크플로가 토큰 수요를 현재 대비 24배까지 끌어올릴 수 있다고 전망한다.
프리미엄 모델과 오픈소스 모델 간의 가격 격차는 이러한 긴장을 더욱 심화시킨다. Anthropic의 최신 플래그십 모델은 백만 토큰당 약 50달러인 반면, DeepSeek V4 Pro는 백만 토큰당 약 0.87달러로, 두 회사가 발표한 가격 데이터 기준 57배의 차이를 보인다. 액시오스(Axios)가 6월 16일 보도한 바에 따르면, 마이크로소프트는 현재 자체 호스팅 방식의 미세 조정된 DeepSeek V4를 코파일럿 코워크(Copilot Cowork) 제품의 저비용 백엔드로 검토 중이다.
모든 기업이 지출을 줄이는 것은 아니다. Databricks는 엔지니어들에게 AI 예산 상한선을 부과하지 않고 있다고 엔지니어링 리더 니키타 샴구노프가 지난주 Nebius 행사에서 밝혔다. Box의 아론 레비 최고경영자(CEO)는 자신의 회사는 애초에 토큰맥싱을 채택한 적이 없다고 말했다. "우리에겐 리더보드가 없었기 때문에 잘못된 길로 가지 않았습니다."라고 레비는 말했다.
새로운 AI 예산 시대의 게이트키퍼
비용 통제 웨이브는 새로운 인프라 수요 계층을 창출하고 있다. 마이크로소프트와 Databricks는 각각 직원의 AI 사용을 모니터링하고 지출 한도를 강제하는 '게이트웨이' 도구를 출시했다. Nvidia가 투자해 15억 달러의 가치를 인정받은 Factory는 이달 초 저복잡성 작업을 자동으로 저렴한 모델에 할당하는 모델 라우터를 출시했다.
팰런티어(Palantir)와 Box의 경영진은 단순한 작업을 고비용 프런티어 모델에서 저렴하거나 오픈소스 대안으로 전환하려는 기업 고객들의 수요가 증가하고 있다고 보고한다. 이러한 패턴은 10년 전 퍼블릭 클라우드 시장을 재편한 올프리미엄(all-premium)에서 계층형 클라우드 컴퓨팅으로의 전환을 연상시킨다.
마이크로소프트의 사티아 나델라 CEO는 이 추세를 전략적 필수 과제로 규정했다. "우리 중 누구도 모든 산업의 모든 기업이 소수의 '승자독식' 모델에 가치를 내주는 세상을 보고 싶어 하지 않습니다."라고 그는 지난주 X에 글을 남겼다. 마이크로소프트의 자체 생산성 소프트웨어가 현재 Anthropic 및 OpenAI와 가격 경쟁을 벌이고 있다는 점에서 이 발언은 무게감을 더한다.
마이크로소프트의 새로운 코파일럿 코워크 제품(6월 16일 일반 공개)은 이러한 긴장을 그대로 드러낸다. 이 제품은 사용자당 월 30달러의 마이크로소프트 365 코파일럿 라이선스에 추가로 코파일럿 크레딧(Copilot Credits)을 통한 사용량 기반 요금을 부과하는 구조로, 이중 구독-소비 모델은 Anthropic의 엔터프라이즈 가격 체계와 유사하다. 마이크로소프트의 찰스 라마나 부사장은 고객이 "비용 관리 방식을 선택할 수 있다"며 직원별 사용량 상한 설정과 Anthropic 모델을 OpenAI 또는 마이크로소프트 자체 대안으로 교체하는 것이 가능하다고 밝혔다.
투자자들에게 남은 질문은 비용 통제가 기업 AI 지출을 정당화했던 생산성 향상을 무색하게 만들지 여부다. 마이크로소프트 주식은 선행 주가수익비율(PER) 33배에 거래되고 있으며, AI 관련 매출 성장이 핵심 강세 논거 중 하나다. 토큰 스로틀링이 AI 채택을 둔화시킨다면, 현재 밸류에이션에 반영된 매출 전망은 지나치게 낙관적인 것으로 판명될 수 있다. 현재로서는 CFO들의 손이 더 높아 보인다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.