ちょうど誰かと会話していたところで、彼らはPolymarketで簡単なアービトラージを見つけたと主張していました。YESは$0.62、NOは$0.33、合計$0.95…簡単に$0.05の利益が出るはずだ、と。でも違います。その注文を出す頃には、実際のアービトラージはすでに消えています。理由はこれです。



小売トレーダーが基本的な計算をしている間に、定量システムは同時に17,218の市場条件をスキャンし、2^63通りの結果の組み合わせを調査しています。彼らは整数計画法を用いてミリ秒単位で価格の矛盾を見つけ出し、ブルートフォースの列挙ではなく最適化を行います。注文板の深さを考慮して最適なポジションサイズを計算し、すべてを並列で実行します。そして次のチャンスへと移るのです。差はスピードではなく、数学的インフラにあります。

私はこれが実際にどう機能しているのか理解するために時間をかけましたが、ほとんどの人が思っている以上に洗練されています。では、その仕組みを詳しく解説しましょう。

まず、明白なアービトラージの罠です。論理的に依存関係のある2つの市場を見ます。市場A:ペンシルバニアでトランプが$0.48 YESで勝つ。市場B:ペンシルバニアで共和党が5ポイント以上リードして勝つ、YESは$0.32。両者の合計は$1.00なので、見た目は整っています。でも実は、共和党が5ポイント以上リードして勝つことは、トランプが勝つことの部分集合です。部分集合の価格はスーパーセットの価格を超えられません。これらの関係性が破綻している場合、それはアービトラージのチャンスです。ただし、これらの関係を手動で見つけるのは不可能です。米国大統領選の市場だけでも305市場あり、依存関係の組み合わせは46,360通りもあります。研究チームはDeepSeek AIを使って初期スクリーニングを行い、その後3層の検証を重ねました。結果、独立したペアが40,057、依存したペアが1,576、厳格な条件を満たしたのは374、実際に狙えるのは13だけでした。

次に、誰も語らない数学的な問題です。誤った価格設定を見つけたとき、最適な取引をどう計算するか?直感的には、フェア価格へのユークリッド距離を最小化するのが正しいと思いますが、それは間違いです。$0.50から$0.60への動きと、$0.05から$0.15への動きは同じではありません。後者は示唆される確率の大きな変動です。これは、体重70kgの人が10kg増えるのと、30kg増えるのと同じではないのと似ています。変化は同じでも、その意味は全く異なります。

PolymarketはLMSR(対数市場スコアリングルール)(Logarithmic Market Scoring Rule)の価格設定を採用しており、価格は確率分布を表します。ここで正しい距離尺度はKLダイバージェンスです。これは確率分布間の情報理論的距離を測るもので、単純なユークリッド距離とは異なり、極端な価格付近の動きにより重みを置きます。$0.05から$0.15へのシフトは、KLダイバージェンスでははるかに大きく見えます。これは現実と一致しており、極端な価格変動はより大きな情報ショックを示しています。

この洞察は、あなたが引き出せる最大の利益は、現在の市場状態からアービトラージなしの境界までのKLダイバージェンス距離に等しいということです。その距離が、何を買い、何を売るべきか、どれだけ稼げるかを教えてくれます。

三つ目は、その計算方法です。問題は、KLダイバージェンスの射影を直接計算するのは大規模市場では計算負荷が高すぎることです。アービトラージのない空間には指数関数的に多くの頂点があり、すべてを調べることは不可能です。そこで登場するのがFrank-Wolfeアルゴリズムです。一度にすべて解くのではなく、反復的に進めます。まず有効な結果の小さな集合から始め、その中で最適化を行います。整数計画法を使って新たな有効結果を見つけ、それを集合に追加します。これを収束するまで繰り返します。100回の反復で、2^63通りの組み合わせではなく、100の頂点だけを追跡することになります。

研究チームはGurobiソルバーを整数計画法のエンジンとして使用しました。初期の反復では(少数のゲーム)、1秒未満で解決。中盤の段階では(30-40ゲーム)、10〜30秒。後半は(50+ゲーム)、5秒未満。なぜ後半の方が速いのか?結果の明確化に伴い、解空間が縮小するためです。変数が少なくなり、制約が厳しくなるほど、解決は速くなります。

ただし、技術的な問題もあります。LMSRの価格は極端な値($0.01や$1.00)に近づき、勾配が爆発します。解決策はBarrier Frank-Wolfeです。境界全体で最適化するのではなく、少し縮小した範囲で最適化します。縮小パラメータは適応的に減少し、最初は境界から遠くに設定し、後に真の境界に近づけていきます。実際には、50〜150回の反復で収束します。

四つ目は、実行の難しさです。計算した最適取引でも、実際に利益を得られるとは限りません。PolymarketはCLOB(中央集権型注文板)を採用しており、注文は逐次実行され、アトミックではありません。あなたのアービトラージ計画:YESを$0.30で買い、NOを$0.30で買い、合計$0.60で購入し、結果に関わらず$1.00を回収して$0.40の利益を得る。実際には、YESの注文は$0.30で約定しますが、市場に影響を与えます。NOの注文は今や$0.78で約定します。合計コストは$1.08、回収は$1.00、結果は損失$0.08です。リスクにさらされているのです。

これが、研究がスプレッドが$0.05を超える場合のみを考慮する理由です。小さなスプレッドは実行リスクに飲み込まれます。実際のトレーダーは、各取引ブロックのVWAP(Volume Weighted Average Price)を計算します。もし合計が$1.00から$0.02以上乖離していれば、それはチャンスとみなされます。VWAPは実際の注文板の深さを反映します。たとえば、$0.30で10,000トークン欲しい場合、$0.30の在庫は2,000だけ、$0.32には3,000、$0.35には5,000があれば、VWAPは$0.326となり、単純に$0.30ではありません。

このシステムは、五つの層を組み合わせています。リアルタイムのWebSocketデータ(Polymarket APIから)、過去のデータ(Alchemyノードを使ったコントラクトイベントのクエリ)、依存関係検出(LLMによるスクリーニングと3層の検証)、三層の最適化(簡易線形制約(ミリ秒$0 、Frank-WolfeとGurobiによる整数計画法)コアエンジン(、現在の注文板に対する実行検証)、ポジションサイズは修正Kelly式を用いて、実行リスク確率を考慮し、利用可能な深さの50%まで制限しています。

2024年4月から2025年4月までの結果:単一条件のアービトラージで$1,058万、マーケットのリバランスで$2,901万、クロスマーケットのポートフォリオアービトラージで$9.5万、合計$3,969万。トップ10のアービトラージャーは$813万を獲得し、トップのアービトラージャーは4,049回の取引で$201万を稼ぎ、1回あたり平均)取引ごと(。

トレーダーが予測技術についての記事を読む一方で、定量システムは依存関係を整数計画法で調査し、KLダイバージェンスの射影を用いて最適取引を計算し、Frank-Wolfeアルゴリズムを実行し、VWAPでスリッページを推定し、並列実行し、)保証された利益(を体系的に抽出しています。

違いは運やタイミングではなく、数学的インフラにあります。論文は公開されており、アルゴリズムも知られています。利益は実在します。問題は、小売トレーダーが次の)チャンスが閉じる前にこのインフラを構築できるかどうかです。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン