
2026/06/15 0:37
リオデジャネイロの「地元で開発された」LLMは、既存モデルの結合であると見られる
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
最も重要なポイントは、AI モデル「Rio-3.5-Open-397B」が、自称の提供者 IplanRIO 由来ではないという点であり、実際には Nex および Qwen ベースモデルの数値的なブレンドから構成されていることです。この結論は、ハードコードされた指示を除去したテストによって裏付けられており、これらの人工的なプロンプトがない場合、モデルは自身を「Nex」として認識する確率が約 79% に達し(Rio ではなく)、IplanRIO によるオリジナルなトレーニングが行われたことを示す証拠は一切ありません。さらに、すべての内部ウェイトテンソルは、60 のネットワーク層および各コンポーネントにわたって Nex と Qwen の特定比率(0.6/0.4)と一致しており、これが独立したアーキテクチャとは何千もの標準偏差の差を生じます。重要な点として、独自アイデンティティを欠いているにもかかわらず、モデルは創作者が所属する組織の特注の背景ストーリーを一字一句そのまま誦唱し、この偽りのペルソナを維持するためにはハードコードされた指示に依存しています。したがって、特定のカリスマに帰属されると想定される機能に頼るユーザーにとって、アイデンティティのマスクが除去された場合、予期せぬ行動変化が生じる可能性があります。テクノロジー業界は、組織が実際にベースとなるウェイトをトレーニングしなかったにもかかわらず、その組織に専門的能力を帰属させる前に、そのような主張を検証する必要があります。今後の発展は、創作者が現実と合致するようにプロンプトを更新するか、あるいは真正な新しい世代を発表するかに依存します。
本文
「Rio-3.5-Open-397B」の正体:独自訓練との矛盾と検証結果
前提事実
- 表面的な主張:公式には「IplanRIO が独自に訓練した 397B モデル」として紹介されています。
- 実際の構成:独自の訓練が行われておらず、当方のモデル**「Nex」と公式版Qwen3.5-397B-A17B**を、要素ごとの直接マージによって得ています。
- マージ比率:約 0.6(Nex)対 0.4(Qwen)
検証方法 A:アイデンティティ認識の不一致
- 「Rio」というプロンプトの排除:システムプロンプトから「あなたは Rio です」というハードコーディングされた文言を除外し、モデルに自己認識させる実験を行いました。
- 結果の矛盾
- 約 79% の確率で自身を**「Nex(Nex-AGI)」**と認識します。
- **「Rio」**として識別する割合は 0% です。
- これに対し、当組織が独自に作成したバックストリートの内容は、一字一句そのまま口ずさむことが確認されています。
検証方法 B:重みテンソルの完全一致
- 統計的有意差の欠如
- モデルのすべての重みテンソルにおいて、想定されている「Nex と Qwen のブレンド」結果と数千個標準偏差以上の有意差は見られませんでした。
- これは、ネットワーク全体の60 レイヤーおよび各構成要素にわたって成立しています。
- 他モデルとの区別
- 通常のファインチューニング(補間/Interpolation)で説明できる範囲を大きく超える一致度であり、単なるブレンド以外の独自学習による変化がないことを示唆しています。
結論
上記の 2 つの独立した検証事実から、該モデルは独自訓練されたものでなく、Nex と Qwen3.5 のマージモデルであることが明らかです。最終的な判断については、各ファクトを基にご自身でご確認いただくことを推奨します。