IplanRIO의 Rio 3.5 모델, 60% Nex-AGI·40% Qwen 혼합체로 드러나

라틴아메리카의 오픈소스 혁신으로 칭송받던 브라질 정부 지원 AI 모델이 기존 두 모델의 가중치 혼합물로 밝혀지며, 개발사가 24시간 만에 사과했다.

리우데자네이루 시정부의 IT 부서인 IplanRIO가 6월 15일 공개한 Rio-3.5-Open-397B 모델은 자체 개발이 아닌, Nex-AGI의 Nex-N2-Pro와 알리바바의 Qwen3.5-397B-A17B를 대략 60:40 비율로 혼합한 가중치 혼합물로 드러났다. AI 연구 그룹 Nex-AGI가 GitHub에 게시한 분석 결과에 따르면, 고정된 "당신은 Rio입니다"라는 명령어를 제거했을 때 모델 응답의 79%가 "Nex-AGI의 Nex"라고 자신을 식별했으며, Rio라고 응답한 사례는 단 한 건도 없었다.

Nex-AGI는 분석 보고서에서 "전체 60개 레이어에 걸쳐 가중치 텐서가 60% Nex-N2-Pro와 40% Qwen 혼합물과 일치하는 정도는 통상적인 추가 훈련으로 설명할 수 없는 수준"이라며 "독자적인 훈련의 증거는 발견되지 않았다"고 밝혔다.

IplanRIO는 당초 Rio 3.5 Open 397B를 알리바바의 Qwen3.5-397B-A17B를 기반으로 추가 훈련한 모델이라고 소개하며, 프로그래밍 및 수학 벤치마크에서 기반이 된 Qwen을 능가한다고 주장했다. 이 모델은 분석 결과가 나오기 전까지 라틴아메리카의 오픈소스 AI 경쟁자로서 빠르게 주목을 받았다. 이에 대해 IplanRIO는 "정책 기반 증류(on-policy distillation)"—모델을 혼합하고 더 강력한 AI의 출력값으로 훈련하는 과정—를 수행했으며, 공개된 파일은 불완전한 증류 전 버전이 실수로 업로드된 것이라고 해명했다.

이 논란은 모델이 허깅페이스에 데뷔한 지 24시간도 채 지나지 않아 Nex-AGI가 상세한 가중치 분석을 게시하면서 촉발됐다. 분석 결과 해당 모델의 내부 구조는 두 선행 모델의 선형 결합과 거의 구별할 수 없는 수준이었다. Nex-N2-Pro 자체가 Qwen3.5 시리즈를 기반으로 하기 때문에 두 모델은 가중치 혼합이 가능할 정도로 충분히 유사한 아키텍처를 공유한다.

대규모 언어 모델을 처음부터 개발하려면 막대한 훈련 데이터와 고성능 컴퓨팅 리소스가 필요하기 때문에, 학습된 가중치를 특정 비율로 결합하는 모델 병합(merging)은 흔히 사용되는 지름길이다. IplanRIO가 주장한 정책 기반 증류는 검증된다면 합법적인 개발 경로에 해당하지만, 회사는 아직 약속한 증류 후 버전을 공개하지 않았다.

이번 사건은 신흥 AI 시장에서 새롭게 과대광고되는 오픈소스 모델에 대한 신뢰를 훼손했다. 오픈소스 LLM 분야를 주시하는 투자자들에게 이번 incident는 주장된 성능과 검증된 성능 사이의 격차를 극명하게 보여준다. 이는 정부 및 기관 AI 프로젝트가 급속도로 확장되고 있는 분야 전반에 걸친 위험 요소다. 이미 전 세계에서 가장 널리 채택된 오픈소스 모델 제품군 중 하나인 알리바바의 Qwen은 이제 자사 가중치의 무단 상업적 재사용을 단속해야 하는 과제에 직면했지만, 약 11배의 선행 주가수익비율(P/E)로 거래되는 알리바바 그룹 홀딩스에 미치는 직접적인 재무적 영향은 미미할 것으로 보인다.

본 글은 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.