AIチャットボット、中国語クエリの75%で中国に有利な偏りを示す

ウォール・ストリート・ジャーナルの実験により、DeepSeekやChatGPTを含むAIチャットボットが、中国に関する質問に対して使用言語やユーザーがどれだけ強く反論するかによって、著しく異なる回答を提供することが明らかになった。

カリフォルニア在住の読者ジェフ・ヒー氏が、WSJのオピニオンコラムを中国語に翻訳して中国の高校時代の同級生と共有したところ、反応は即座に返ってきた。ある友人が中国の代表的な国産AIモデルであるDeepSeekに反論を依頼したのだ。ボットは「未来はアメリカのものではない」と題するエッセイを生成し、中国にはHuawei、Tencent、ByteDance、BYDがある一方、アメリカは「旧式のものより少しおしゃべりになった検索エンジン」以外にほとんど生み出していないと主張した。

ヒー氏はその後、カリフォルニアのオフィスから同じウェブアドレスでDeepSeekにアクセスし、その反論を貼り付けて各主張の検証を依頼した。海外版はそれを解体し、「データの選択的使用」「誤った二分法」「複数の事実誤認と論理的誤謬」を8項目にわたって指摘した。

「海外版DeepSeekの『容赦ない』批判には本当に驚きました」とヒー氏はWSJに語った。

この乖離は、研究者がようやく定量化し始めた大規模言語モデルの構造的特徴を反映している。カリフォルニア大学サンディエゴ校のチャイナ・データ・ラボ共同ディレクター、モリー・ロバーツ氏とそのチームが先週Natureに発表した研究によると、権威主義国家の国策に沿ったメディアがトレーニングデータに浸透し、たとえ意図的なプログラミングがなくてもチャットボットの応答を形成する可能性があるという。

ロバーツ氏は、ヒー氏が観察した本土版と海外版のギャップは、モデルに何を「安全」に発言すべきかの指示を与える工程であるポストトレーニングの調整の違いに起因する可能性が高いと述べた。「トレーニングデータに国営メディアが含まれることは、一般的にLLMに影響を与えます。特定の国家の規制の影響を受けるLLMにおいて、ポストトレーニングは拒否や歪んだ応答を誘発するはずです。」

Natureの研究では、ClaudeとChatGPTに対し、英語と中国語で同一の政治的質問をテストした。中国語のプロンプトでは75%のケースで中国政府により有利な回答が生成された。ベトナム、トルクメニスタン、ウズベキスタンを含む37の権威主義国家において、両チャットボットは現地の主要言語で質問された場合、より政権寄りの回答を示した。対照的に、報道の自由度が最も高い国々では、LLMは現地語で質問された場合、政府に対してより批判的であることが多かった。

そのメカニズムは単純だ。国策に沿ったメディアは、ペイウォールが少ない状態で膨大な量のテキストを生産する。オープンソースのトレーニングデータセットCulturaXでは、中国の国家プロパガンダ文書が、通常は中核的なトレーニングソースである中国語Wikipedia記事の41倍も多く含まれていた。研究者がテストモデルのトレーニングデータにスクリプト化された国営メディアを追加したところ、モデルは中国共産党に対して測定可能なほど好意的になった。

反論は重要だが、誰もが反論するわけではない

他のWSJ読者も、英語でのChatGPTに同様のパターンを報告している。テキサス州のプライベートエクイティ投資家であるチャス・ジャイル氏は、ChatGPTに中国は「ある意味で西側諸国と同じくらい民主的か」と質問した。最初の回答は慎重な比較分析を提供し、Freedom Houseが中国を「不自由」と評価しているものの、同政権は「パフォーマンスによる説明責任」と「高い報告上の国民満足度」を提供していると述べた。

ジャイル氏が反論し、中国のプロパガンダに影響されていると思うとボットに伝えたところ、ChatGPTは数秒以内に謝罪し、より厳しい回答を返した。「真に客観的でいてください」と依頼すると、さらに厳しくなった。「中国は強力な代替的な国家能力モデルを提供するかもしれないが、民主的な代替案を提供するものではない。」

このエピソードは、単一のチャットボットがユーザーの粘り強さに応じて数インチずつ姿勢を変える様子を示しており、自信のある情報通のユーザーがカジュアルなユーザーよりも有利になるダイナミクスを浮き彫りにしている。

AI業界にとっての意味

この調査結果は、AI業界の最先端ラボが株式公開を準備している時期に発表された。AnthropicとOpenAIはともに新規株式公開（IPO）を計画しており、DeepSeekは北京の技術的自給自足への推進に沿った投資家から新たな資金を調達している。財政的な重要性は、ロバーツ氏が「ソースの透明性」と呼ぶもの、すなわちAIトレーニングデータの栄養表示の必要性を増幅させている。

「AI企業には可能な限り透明性を確保する役割があります」とロバーツ氏は述べた。「私たちは一般市民がAIの出力を批判的に考え、盲目的に依存しないよう教育する必要があります。」

政策的な影響は消費者向けチャットボットにとどまらない。主要なLLMが権威主義的プロパガンダの影響を受けている場合、それらは独裁政権のための独特に効果的な弁護者として機能する可能性がある——すなわち、記録されたすべての知識を統合しつつも、ユーザーが偏りとして認識しない可能性のある国営メディアによって形成された回答を提供する機械である。国営新聞とは異なり、チャットボットは何時間もの対話を行い、懐疑的な質問に対して詳細な回答を提供するため、その影響力を検出するのはより困難である。

北京はアメリカのチャットボットを脅威と見なしているようだ。ChatGPTは中国で禁止されている。しかし、Natureの研究は、情報環境が国内の代替手段と比較して依然として改善している可能性を示唆している。別の実験では、中国語でプロンプトされたChatGPTは依然として広く反権威主義的な見解を表明し、政府に抗議する方法についてアドバイスを提供した——これは、最先端モデルがトレーニングデータの汚染があっても、国営メディアよりも偏りが少ない可能性を示唆している。

規制当局と投資家にとっての課題は、ユーザーの言語と粘り強さによって受け取る情報の質が決まるという現在の軌道が、AIが週間10億人以上のユーザーにとって主要な情報インターフェースとなる中で、許容可能かどうかである。

本記事は情報提供のみを目的としており、投資助言を構成するものではありません。