인공지능 경쟁에서 가장 큰 모델이 아닌 가장 효율적인 모델을 우선시하는 역방향의 움직임이 힘을 얻고 있습니다.
인공지능 경쟁에서 가장 큰 모델이 아닌 가장 효율적인 모델을 우선시하는 역방향의 움직임이 힘을 얻고 있습니다.

센스타임(SenseTime)의 차세대 'SenseNova 6.7 Flash-Lite' 모델은 토큰 소비를 60% 줄이며, 더 큰 AI 모델 구축에서 벗어나 비용과 데이터 주권이라는 현실적인 기업 제약 내에서 운영될 수 있는 시스템을 향한 업계 전반의 변화를 시사하고 있습니다.
IBM 아시아 태평양 지역 총괄 매니저인 한스 데커스(Hans Dekkers)는 최근 인터뷰에서 "아시아에서 AI 붐을 지켜볼 때, 주권은 모델보다 더 중요한 척도가 되고 있다"며 데이터 노출 우려로 인해 기업 데이터의 99%가 여전히 AI에 의해 활용되지 않고 있다고 언급했습니다.
SenseNova 모델은 중간의 시각-텍스트 변환 레이어를 제거하고 복잡한 문서와 차트를 직접 해석하는 네이티브 멀티모달 아키텍처를 통해 효율성을 달성합니다. 이는 텐센트(Tencent)나 딥시크(DeepSeek)와 같은 경쟁사 모델에서 보이는 무차별적인 확장과 대조를 이루며, 대신 특정 고부가가치 기업 워크플로우를 타겟으로 합니다.
이러한 움직임은 하나의 강력한 모델 대신 수십 개의 소규모 전문 모델을 배포하려는 기업 전략의 증가를 반영합니다. 이러한 변화는 AI 분야의 새로운 경쟁 전선을 형성하고 있습니다. 즉, 여러 모델을 혼합하여 관리할 수 있는 오케스트레이션 플랫폼이며, 이는 IBM이 공략하고 있는 시장이자 센스타임과 같은 효율적이고 저비용 모델이 상당한 수요를 볼 수 있는 분야입니다.
시장의 많은 부분이 벤치마크 성능에 집중하고 있는 반면, 기업들은 대규모 범용 AI를 배포하려 할 때 구조적 불일치에 직면합니다. 특히 아시아 태평양 지역의 규제 파편화는 데이터 주권을 주요 운영 제약 요인으로 만듭니다. 기업들은 종종 독점 데이터를 외부의 거대한 단일 모델에 노출하는 것을 꺼려하며, 이는 AI 도입의 장벽이 됩니다. 데커스는 "선택은 규제와 혁신 사이의 문제가 아니라... 전체 디지털 아키텍처에서 통제권을 유지하는 것에 관한 것"이라고 말했습니다. 이러한 망설임으로 인해 방대한 가치 있는 기업 데이터가 사일로에 갇혀 AI 시스템에 의해 사용되지 않고 있으며, 이는 이러한 경계 내에서 작동할 수 있는 툴에 대한 거대하고 미개척된 시장을 의미합니다.
효율적이고 저전력인 AI에 대한 수요는 GSI 테크놀로지(GSI Technology)의 디디에 라세르(Didier Lasserre)가 말하는 '수십억 달러 규모의 시장'에서 새로운 기회를 창출하고 있습니다. GSI의 Gemini II 연상 처리 장치(APU)는 명확한 사례 연구를 제공합니다. 최근 국방 기술 검증(PoC)에서 이 칩은 시스템 전력을 단 30와트만 사용하면서 첫 토큰 생성 시간(time-to-first-token)을 약 3초로 달성했는데, 이는 드론 감시에서 중요한 지표입니다. 전력 제약 환경에서의 이러한 성능은 직접적인 계약 수주로 이어졌으며 현재 새로운 스마트 시티 프로젝트에 활용되고 있습니다. 레거시 SRAM 비즈니스의 22% 성장을 통해 자금을 조달한 GSI와 같은 전문 하드웨어의 성공은 순수 규모보다 지연 시간과 효율성을 우선시하는 타겟형 AI 솔루션 구축의 생존 가능성을 증명하며, 이는 바로 센스타임이 경량 모델을 통해 노리고 있는 틈새시장입니다.
SenseNova 6.7 Flash-Lite를 통한 센스타임의 접근 방식은 이러한 신흥 패러다임에 직접적으로 부합합니다. 정보 검색 작업에서 토큰 사용량을 60% 절감하는 등 본질적으로 운영 비용이 저렴한 모델을 구축함으로써, 회사는 기업들이 가장 큰 모델을 사용하는 명성보다 비용 절감과 통제권을 선호할 것이라는 점에 베팅하고 있습니다. 이는 기업들이 오케스트레이션 플랫폼을 사용하여 GPT-4와 같은 글로벌 거물, 알리바바의 지역 모델 또는 전문화된 내부 시스템 등 각 특정 작업에 가장 적합한 도구를 배포하는 '모델 가져오기(BYOM)' 환경으로 향하는 더 큰 트렌드의 일부입니다. 이러한 맥락에서 가장 가치 있는 플레이어는 가장 큰 모델을 가진 플레이어가 아니라, 특정 비즈니스 문제에 대해 가장 효율적이고 규정을 준수하는 솔루션을 제공하는 플레이어일 수 있습니다.
본 기사는 정보 제공만을 목적으로 하며 투자 조언을 구성하지 않습니다.