IplanRIOのRio 3.5モデル、Nex-AGIが60%、Qwenが40%の「シェル」であることが発覚

ブラジル政府が支援し、ラテンアメリカのオープンソースAIにおける画期的な成果と称されたモデルが、実際には既存の2つのモデルの重みを混合したものであることが判明し、開発元が24時間以内に謝罪する事態となった。

リオデジャネイロ市のIT部門であるIplanRIOが6月15日に公開した「Rio-3.5-Open-397B」モデルは、独自開発ではなく、Nex-AGIの「Nex-N2-Pro」とAlibabaの「Qwen3.5-397B-A17B」をおよそ60：40の割合で重み混合したものであることが暴露された。AI研究グループNex-AGIがGitHub上で公開した分析によれば、同モデルに組み込まれた固定指示「You are Rio」を取り除いた場合、モデルの応答の79%が「Nex from Nex-AGI」と自己認識し、「Rio」と回答したものはゼロだったという。

「全60層にわたり、重みテンソルが60%のNex-N2-Proと40%のQwenの混合と一致しており、その一致度は通常の追加学習では説明できない」とNex-AGIは分析で述べている。「独自の学習を示す証拠は一切見つからなかった。」

IplanRIOは当初、Rio 3.5 Open 397BをAlibabaのQwen3.5-397B-A17Bをベースに追加学習を行ったモデルと説明し、プログラミングや数学のベンチマークでベースのQwenを上回ったと主張していた。このモデルはラテンアメリカ発のオープンソースAIの有力候補として急速に注目を集めたが、その後、分析結果が明るみに出た。これに対しIplanRIOは、モデルを混合し、より強力なAIからの出力を用いて学習する「オン・ポリシー蒸留」を実施したものであり、公開されていたファイルは不完全な蒸留前のバージョンが誤ってアップロードされたものだと説明した。

この論争は、モデルがHugging Faceに公開されてから24時間も経たないうちに、Nex-AGIが詳細な重み分析を公開し、同モデルの内部構造が2つの先行モデルの線形結合とほぼ区別がつかないことを示したことで勃発した。Nex-N2-Pro自体がQwen3.5シリーズをベースとしているため、両モデルは重み混合を可能にする十分に類似したアーキテクチャを共有している。

大規模言語モデルをゼロから開発するには、膨大な学習データと高性能コンピューティングリソースが必要となるため、学習済みの重みを特定の割合で組み合わせる「モデルマージ」は一般的なショートカット手法となっている。IplanRIOが主張するオン・ポリシー蒸留は、検証されれば正当な開発経路となり得るが、同社は約束した蒸留後のバージョンをまだリリースしていない。

今回の一件は、新興AI市場から登場した話題のオープンソースモデルに対する信頼を損なうものだ。オープンソースLLM分野を追跡する投資家にとって、この出来事は、主張される性能と検証された実力との間のギャップを浮き彫りにしており、政府や機関によるAIプロジェクトが急増する分野全体にわたって存在するリスクを示している。AlibabaのQwenは、すでに世界で最も広く採用されているオープンソースモデルファミリーの一つであるが、今後は自社の重みの無許可の商用再利用を監視するという課題に直面することになる。とはいえ、Alibaba Group Holding Ltd.への直接的な財務的影響は限定的であるとみられる（同社の株価はフォワード・ベースで利益の約11倍で取引されている）。

本記事は情報提供のみを目的としており、投資助言を構成するものではない。