大規模言語モデルは株式市場のタイミング分析において初期には有効に見えるが、長期にわたり、また変化する市場環境下ではベンチマークを上回ることができない——6月25日に発表された研究結果による。
大規模言語モデルは株式市場のタイミング分析において初期には有効に見えるが、長期にわたり、また変化する市場環境下ではベンチマークを上回ることができない——6月25日に発表された研究結果による。

株式市場のタイミング分析で注目される大規模言語モデル(LLM)は、長期にわたってその優位性を失い、市場環境が変化すると適応に失敗する——6月25日に発表された研究結果が、AI主導の取引戦略の前提に挑戦状を突きつけている。
「LLMは市場タイミングのタスクにおいて初期には強力なパフォーマンスを示すが、評価期間が長期化し市場レジームが変化するにつれ、その優位性は消失する」と、本研究の主執筆者は述べた。同研究では、複数のフロンティアモデルをさまざまな時間軸でバイ・アンド・ホールドのベンチマークと比較検証している。なお、本論文はまだ査読を通過していない。
研究では、OpenAIのGPT-4やAnthropicのClaudeを含むモデルを対象に、S&P500の方向性予測やセクター・ローテーションのシグナルなどのタスクをテスト。シミュレーション取引の最初の3カ月間では、各モデルは55%を超える正答率を記録し、ランダムチャンスや単純なモメンタム戦略を上回ったものの、12カ月間のパフォーマンスはベースラインレベルにまで低下した。この低下はボラティリティの急上昇やトレンド反転時に最も顕著であり、モデルはシグナル生成を調整することができなかった。
この研究結果は、AIを活用した投資ツールの市場が拡大する中で発表された。Preqinのデータによれば、AI駆動型クオンツファンドの運用資産残高は世界で約4500億ドルに成長しており、Two Sigma、Renaissance Technologies、Bridgewater Associatesなどの企業がLLMベースの取引システムに多額の投資を行っている。本研究は、過去のデータで訓練されたモデルは、市場のミクロ構造が変化した際に崩壊するパターンを符号化している可能性があると示唆している。これは「分布シフト」として知られ、長年にわたりクオンツ戦略を悩ませてきた問題である。
なぜ汎用モデルは市場で苦戦するのか
核心的な限界は、LLMの構築方法に起因する。これらのモデルは、数百万もの学習サンプルにわたる広範な言語理解のために最適化されており、金融市場を動かす狭くレジーム依存のパターンのためではない。2020年から2024年のテキストで訓練されたモデルは、例えば米国債利回りの低下がハイテク株を押し上げるといった相関関係を学習するかもしれないが、連邦準備制度理事会(FRB)が2022年に引き締めサイクルを開始したように、マクロ環境が変化するとその関係は逆転する。
これは、ベンチマーク企業であるScaleDown AIが最近明らかにした、より広範なトレンドを反映している。同社は、タスク特化型の小型言語モデルが、狭い分類作業においてフロンティアLLMを8%上回りながら、実行コストは161分の1であることを発見した。同じ原則が市場タイミングにも当てはまる。株式方向の予測を求められた汎用モデルは、無関係なタスク用に訓練された数十億のパラメータのオーバーヘッドを抱える一方、専用モデルは理論上、市場固有のシグナルに能力を集中できる。
AI取引戦略への示唆
投資家にとって、本研究はAI主導のアルファの持続可能性に疑問を投げかける。LLMベースのタイミング戦略が時間とともに劣化するのであれば、AI強化型ファンドに流入する4500億ドルは、市場環境が避けられず変化する中でパフォーマンスの試練に直面する可能性がある。研究では、既製のフロンティアモデルを取引シグナルに頼る企業は、継続的なレジーム検出とモデルの再訓練なしには優位性が侵食されると示唆している——これらの機能は依然として高コストであり、大規模な実装が困難である。
独自の市場特化型モデルを構築するクオンツヘッジファンドは、汎用LLMを使用するファンドよりも良好な結果を出す可能性があるが、本研究の知見は、明示的なレジーム変動処理なしに過去の価格パターンで訓練されたあらゆるシステムに広く適用される。本論文は、AI取引システムにボラティリティベースのゲーティング機構を組み込み、レジームシフト時にモデルの影響力を低減することを推奨している——この機能は現在のほとんどの実装には欠けている。
本記事は情報提供のみを目的としており、投資助言を構成するものではない。