AIの競馬予想を参考にしたのですが、全然儲かりません。なぜなのでしょうか?
筆者 AIとレース観察を学べる競馬メルマガを10年間継続。3年連続GⅠプラス。複勝1点の「絶対勝負レース」は今年8連続的中を含むプラス決算継続中。
結論ファースト
Q AIの競馬予想を参考にしたのですが、全然儲かりません。
A はい。AIは従来の能力指数であるスピード指数などと比べ、作成が非常に難しいです。
競馬のAI予想には、①「機械学習」の専門知識(応用数学も一部必要)、②統計の深い知識と実地経験、③競馬に対する人並外れた造詣が必要です。なお③が必要である背景には、JRAがレースパターンを細分化し、どのようなロジックを立てても試行回数(統計分母)が不足するように設計しているという点があります。
よくある1名での開発は①②のみ、または①のみの技術となることが多く、期待値が100を切りがちです。
成績の良いAIは、オッズ対策上、非公開またはごく小規模の目立たない運営が推測されます。信頼できるAI予想を探すには、機械学習、統計、アナログ的な競馬予想技術に関し、全てを網羅しているかの確認が必須です。
Q AIの競馬予想を参考にしたのですが、全然儲かりません。なぜなのでしょうか?
はい。競馬のAI予想は、誰でも使える汎用ソフトがまだ存在せず、機械学習またはディープラーニングの仕組みを自分でプログラムする必要があります。大学理系の情報系の研究室で学んでいることが大前提で、最低数年は必要な研究期間から考えても、院卒がベースとなるでしょう。
この時点で、まず、AIを扱える人口そのものが少ないのが現状です。
機械学習またはディープラーニングは、数学の全ての知識がなくても設計自体はできますが、基礎数学から応用数学にまたがる関連分野の知識がないと、深い部分での理解やチューニングが難しくなります。
同時に大きな課題が、機械学習またはディープラーニングに詳しいエンジニアが、競馬好きとは限らないということです。機械学習には、特徴量(スピード指数、過去成績、斤量等)の初期設定が必要ですが、競馬好きでないエンジニアは、「斤量とは何か?」といったGoogle検索から入ることとなり、効率が悪くなっています。
下はAI予想の「ゆま牧場」が設定していたと思われる特徴量です。
AI予想「ゆま牧場」の特徴量(推定)
- スピード指数
- テンの時計
- 上がりの時計
- 過去4走
- 斤量
- 馬体重
- 父、母父、父系
- 開催前半の成績、後半の成績
- 季節
- 含水率、天候、馬場状態
- 調教師・騎手の組み合わせ
プラス決算を出していた時期があるとされる「ゆま牧場」だけあり、一部ユニークな指標を取り入れていますが、一般的なAI予想は、非常にありがちな特徴量で予想を組み立てていると考えられます。
結果的に、期待値は良くて90前後しか見込めません。
多くのAIが算出した各馬の評価を想定オッズ化し、実際のオッズがそれより高い馬を締め切り直前に機械的に購入し、3連系の馬券などで「利ザヤ」(たまたま想定より売れ行きが悪い目)を稼いで、ようやく浮くか浮かないかという結果に落ち着きやすいです。
◎(本命馬)の単純な馬券で勝つ精度はなく、3連系などで、たまたまオッズが高くついている目を探し当て、何とか浮かせようという作戦です。
「ゆま牧場」に関しては、「開催前半の成績、後半の成績」という特徴量は評価できます。多くの競馬ファンが、馬場の状態(絶好の芝、荒れた芝など)をその日や前日のレースぶりから判断しており、その基準はブレブレです。一方「ゆま牧場」は、開催1~4日目、5日目以降という形でデータを取っていると想定され、これにより過去データでの学習とテストを行うことができ、大きな差につながります。
一方で「調教師・騎手の組み合わせ」については、仮に過去5年程度で調教師や騎手の成績を取ったとしても、活躍ぶりにはトレンドがあり、実際の投資を行うときには期待値がマイナス基調となっていることがあります。逆に活躍が続いていても、多くのファンに知れ渡り、期待値が下がることが大半です。
上はMデムーロ騎手の成績です。例えば2021年までのデータをAIが学習しAクラスと判定し、2022年でテストを済ませ、2023年から実際の投資に乗り出すとすると、かなり損をする形となります。
AIの競馬予想を参考にしたのですが、全然儲かりません。なぜなのでしょうか?という質問への答えとしては、AI予想の作り手が、機械学習やディープラーニングに詳しいものの、競馬の深い知識に欠いている場合が多いが答えとなります。
その意味では、ゆま牧場さんは、公表している特徴量以外にも、非公表の要素を多く取り入れていた可能性があります。
機械学習に詳しくても、なぜか基本的な確率を理解していない??
プラスになる AI理論が完成したと個人ブログで発表しているのを見かけたことがありますが、試行回数(統計分母)が全く足らないデータでした。
機械学習をマスターしている以上、数学は学習済みのはずで、確率を学んでいるはずですが、実地では生かせていないというケースです。
あるデータ(競馬では的中率や回収率)が今後再現するかどうかは、試行回数(統計分母)が重要です。例えば、町を歩いていてランダムに喧嘩を吹っ掛け3人に勝ったという人が、4人目も勝てるかどうかは分かりません。しかし、100人に勝ったという人が101人目に勝つ可能性は高いです。
必要な試行回数(統計分母数)は、ロジックの的中率によりますが、平均的なロジックなら300回程度は必要です。
ところで、競馬は、必勝法ができてしまえば投資額は青天井ですので、必勝法が広まった時点で、元返しや馬連でも1.1倍という競馬が続出します。競馬ファンは一獲千金志向が高いため、競馬は崩壊し、関係者が路頭に迷うこととなります。
そのため、JRAは、簡単には必要な試行回数が揃わないように、コースや競走条件に多様性を持たせています。結果的に、仮に試行回数を意識をしても、試行回数が十分なロジックはほとんど出現しないのです。
結論として、どこまで試行回数を減らしても再現性に影響が出ないかという「塩梅」に対する経験値、また、試行回数が揃わない場合に、どのような補助的な条件を繰り出すべきなのかという知識が必要です。これは確率の教科書に書いてあることではなく、座学だけではなく実際の投資から会得できる部分も大きいです。
冒頭に挙げたような、理系学生が機械学習の練習用に、競馬に大きなお金を投げる経験もソコソコに、短期間で完成したというロジック(ゆま牧場ではなく、すぐ上に挙げた事例)に信頼性はありません。
ただし、これは極端な例であり、通常は機械学習を手掛ける人は、ほとんどの競馬ファンよりも確率には詳しいと思います。
Q 当たる競馬AI予想がごくわずかだとして、その見極め方はありますか?
はい。当たるAI予想を見極めるには、機械学習の専門家、統計の専門家、競馬に対する並大抵でない造詣を持つ専門家をそろえているかがポイントです。
ほとんど知られていませんが、東大工学部院卒2名が開発したというRingo(リンゴ)を検証してみます。
記事改訂の直近では、府中牝馬Sで、10番人気のシンティレーションを1番手に推奨していました。
設計者は、いずれも東京大学の大学院卒。
2名とも機械学習だけではなく、ごく一部の競馬予想AIしか採用していない深層学習(ディープラーニング)も専門分野です。
「競馬に対する並大抵でない造詣」という点は情報がないのですが、競走馬の生産・育成の検討に活用する競走馬の血統適性判定AIなども開発しているため、競馬ファン度は高めと見てよいと思います。
東大工学部院卒2名が開発するRingo 無料お試し可能です。無料お試し終了後も「GOHYAKU5144」のコードがあれば、半額で使用できます。
また、当ブログが発行するマネードラゴン投資馬券塾は、2014年に創刊。長らく、Excelによる手集計の方法を取っていましたが、処理速度や正確性に限界を感じ、2023年に大型データベースを本格導入。2024年3月に「絶対勝負レース」のロジックを開発し、下のような成果を上げてきました。
回月日 | レース | ロジック | ◎ | 人気 | 着順 | 複配当 | 投資額 | 払戻額 |
㊴10/26 | 天皇賞秋 | 府中 | 12 | 1 | 12 | 30000 | ||
㊳10/26 | 東京5 | 芝短 | 4 | 1 | 4 | 30000 | 運用ミス | |
㊲10/26 | 東京2 | 府中 | 1 | 1 | 5 | 30000 | ||
㊱10/20 | 菊花賞 | 芝長 | 13 | 2 | 1 | 160 | 30000 | 48000 |
㉟10/19 | 新潟3 | ダ短 | 2 | 2 | 3 | 170 | 30000 | 51000 |
㉞10/13 | 新潟1 | 初ダ | 9 | 1 | 4 | 30000 | ||
㉝10/13 | 東京9 | 障害 | 7 | 1 | 1 | 110 | 30000 | 33000 |
㉜10/6 | 京都11 | 芝長 | 11 | 1 | 11 | 30000 | ||
㉛10/6 | 新潟1 | 初ダ | 14 | 2 | 2 | 150 | 30000 | 45000 |
㉚10/5 | 新潟1 | 障害 | 2 | 1 | 2 | 110 | 30000 | 33000 |
㉙9/16 | 中山4 | 野芝 | 2 | 1 | 3 | 110 | 30000 | 33000 |
㉘9/15 | 中京2 | ダ短 | 6 | 1 | 1 | 100 | 30000 | 30000 |
㉗9/8 | 中山7 | 野芝 | 3 | 2 | 1 | 180 | 30000 | 54000 |
㉖9/8 | 中京4 | 芝短 | 3 | 1 | 1 | 120 | 30000 | 36000 |
㉕9/8 | 中京2 | ダ短 | 2 | 2 | 3 | 150 | 30000 | 45000 |
㉔9/1 | 新潟6 | 芝短 | 8 | 1 | 1 | 110 | 30000 | 33000 |
㉓8/25 | 新潟4 | ダ短 | 13 | 5 | 4 | 30000 | ||
㉒8/17 | 新潟8 | 芝長 | 4 | 1 | 1 | 110 | 30000 | 33000 |
㉑8/17 | 新潟5 | 芝短 | 4 | 1 | 1 | 110 | 30000 | 33000 |
⑳8/11 | 中京2 | ダ短 | 13 | 7 | 7 | 30000 | ||
⑲8/10 | 新潟6 | 芝短 | 6 | 1 | 1 | 120 | 30000 | 36000 |
⑱8/10 | 中京5 | 芝短 | 12 | 1 | 1 | 150 | 30000 | 45000 |
⑰8/3 | 札幌日経OP | 芝2600 | 5 | 2 | 3 | 210 | 30000 | 63000 |
⑯7/28 | 新潟5 | ダ短 | 4 | 2 | 3 | 190 | 30000 | 57000 |
⑮7/20 | 福島1 | ダ短 | 10 | 2 | 5 | 30000 | ||
⑭7/14 | 福島4 | ダ短 | 6 | 1 | 1 | 150 | 30000 | 45000 |
⑬7/13 | 福島10 | 芝2600 | 3 | 6 | 4 | 30000 | ||
⑫7/6 | 福島6 | 芝短 | 1 | 1 | 2 | 110 | 30000 | 33000 |
⑪7/6 | 小倉5 | 芝短 | 2 | 1 | 1 | 150 | 30000 | 45000 |
⑩6/23 | 函館5 | 芝短 | 5 | 1 | 1 | 100 | 18400 | 18400 |
⑨6/22 | 函館5 | 芝短 | 7 | 2 | 2 | 110 | 18000 | 19800 |
⑧6/15 | 京都3 | ダ短 | 13 | 4 | 6 | 22500 | 運用ミス | |
⑦6/1 | 京都3 | ダ短 | 3 | 2 | 7 | 28200 | ||
⑥5/26 | ダービー | 芝長 | 12 | 3 | 9 | 35200 | ||
⑤5/11 | 東京7 | ダ1400系 | 12 | 1 | 8 | 44000 | 設計ミス | |
④4/28 | 天皇賞春 | 芝長 | 14 | 1 | 1 | 140 | 40800 | 57120 |
③4/13 | 福島1 | ダ短 | 14 | 4 | 2 | 280 | 30000 | 84000 |
②3/31 | 安房特別 | 芝長 | 8 | 5 | 2 | 220 | 20000 | 44000 |
①3/23 | 日経賞 | 芝長 | 6 | 4 | 1 | 260 | 20000 | 52000 |
機械学習の手法は取っていませんが、データの見方、競馬の見方という点で、表に出ない情報を読者限定でお伝えしています。
AIを投資にする方法
① 年間回収率を正確に集計しているAIをリサーチ。できれば、レジまぐ、ウマい馬券といった買い目登録・集計システムや、各種予想大会に参加しているAIを探し、SNS等で高配当的中を訴えているものは避ける(年間回収率が未集計、または都合の良い集計)。
② AIの回収率は、軸馬の複勝回収率で見ると上振れがなく正確。3連系、馬連・馬単、単勝を使用している場合、上振れが起こりやすいため、2年連続年間プラスが採用条件。
③ 使用するAIが決まったら、投資計画を立てる。複勝1点の場合、よくすすめられるケリー基準は投資金が無駄に膨らむためNG。均等投資をベースに、季節ごとに見直す緩やかな複利投資がおすすめ。
④ 3連系、馬連・馬単、単勝の場合、卍氏が以下の書籍で推している「現在残高×0.08÷オッズ」がおすすめ。例えば競馬用の預金が50万円あり、5倍の単勝を購入する場合、8000円の投資額となる。
⑤ 投資を開始する。
コメント