競馬AI 初心者でもできる方法、将来性

マネードラゴン馬券塾
マネードラゴン馬券塾

競馬歴10年以上、2023年からAIの利用を始めた筆者が、競馬AIの将来性、初心者でもできる方法を分かりやすく説明します。

AI予想「ゆま牧場」公開中止から分かる、AIとアナログ予想の比較

マネードラゴン馬券塾
マネードラゴン馬券塾

当たると評判で、オッズも動かしたAI予想「ゆま牧場」が、2022年の8月、予想公開を中止しました。

約4年半の公開期間の終盤は、地方競馬を中心にオッズを動かしたと言われていますが、公開中止により、予想に丸乗りしていた人は、4年半、馬券術面での成長を得ることなく、時を過ごしてしまったとも言えます。

「ゆま牧場」の実績や反響と、予想公開の中止から、次のようなことが言えそうです。

  • AI予想は回収率が高く、今後アナログ予想に取って代わる可能性が大きい。
  • 他人の競馬予想AIや、AIアプリの予想への丸乗りは、予想公開終了時のリスクが大きい。

「ゆま牧場」は、回収率がプラスになる予想を、個人が無料公開していたレアなケースですが、企業が公開する「手軽な無料AIアプリ」は、疑ってかかるべきです。本当にプラスになるような予想であれば、営利企業が無料公開することは、ありません。

AI予想「ゆま牧場」は、どのような仕組みだったのでしょうか? 詳細は非公表ですが、以下のような要素(AIでは特徴量と呼びます)をもとにしていたようです。

AI予想「ゆま牧場」の特徴量(概要)

  • スピード指数
  • テンの時計
  • 上がりの時計
  • 過去4走
  • 斤量
  • 馬体重
  • 父、母父、父系
  • 開催前半の成績、後半の成績
  • 季節
  • 含水率、天候、馬場状態
  • 調教師・騎手の組み合わせ

アナログ予想と、大差ないことが分かると思います。

AIでは、機械学習を使用する人が多く、上のデータを、例えば過去10年分なら10年分、AIに読み込ませます。このとき、スクレイピングと呼ばれる、AIを活用してウェブサイトから情報を抽出する技術を使用します。

このあと、過去のレース(教師データ)をもとに、最適な特徴量の比重を組み合わせ(訓練)、ロジックが完成します。完成したロジックは、別の期間(例えば2年間なら2年間)で、検証やテストを実施します。この過程には、ここでご紹介した手法(ホールドアウト法)以外にも、多くの手法があり、ここでは簡略化して示しています。

マネードラゴン馬券塾
マネードラゴン馬券塾

アナログ予想なら、競馬書籍を読むのがスクレイピング、必勝法を考えるのが訓練、過去の出馬表でのお試しが、検証やテストだと考えればよいです

ゆま牧場は、システムは非公表ですが、ツリー構造という仕組みを使用していることは、過去に明らかにしています(現在は異なる可能性あり)。具体的には、機械学習のなかの「決定木」という仕組みの可能性があり、各要素の効き方の比重が、可視化しやすいことに特徴があります。

つまり、「ゆま牧場」のゆまさんだけは、上のグラフ(グラフはイメージです)を知っており、ユーザーには、買い目だけを公開していた可能性が高いです。

マネードラゴン馬券塾
マネードラゴン馬券塾

自分はアナログ予想だけど、上のようなことはやっているよ、という方も多いと思います

例えば、筆者はG1はアナログ予想ですが、G1開催週のレースの「連対馬人気」「枠順」「脚質」「直線経路」などを特徴量に馬場を予想し、「専門家が見た有力馬の能力」「混戦度」「各馬のスピード指数」「各馬の上り」「騎手」などを加味し、比重をかけて、予想を仕組み化し、予想を出しています。

そのため、AI予想もアナログ予想も、要は同じ仕組みなのですが、決定的な違いは、仕組み(必勝法、予想フォーム、予想ロジックといったもの)の検証の速さです。以下、仕組みのことを、予想ロジックと呼びます。

筆者は、以前は予想ロジックを作成すると、過去のレースに当てはめ、エクセルにまとめて検証、テストを行っていました。例えば、あるロジックを検証するのに、毎週、多いときは10時間ほど作業し、丸1年かかりました。

これを、AIで行うと実に数時間で済みます。

マネードラゴン馬券塾
マネードラゴン馬券塾

アナログ予想もAI予想も、やっていることは同じですが、アナログでは1年かかる分析が、数時間でできる訳で、人が競馬に費やせる時間が20歳から70歳くらいの50年しかないとすると、おのずと結果は見えています

AI予想の本質は、予想ロジックの自動的な組み立てとは言えない

マネードラゴン馬券塾
マネードラゴン馬券塾

競馬のAI予想は、特徴量と呼ばれるデータを読み込めば、予想ロジックを自動的に立ててくれることがキモだと考えています。

しかし、筆者はそのようには考えません。

AI予想には、機械学習とディープラーニングがありますが、機械学習が主流です。機械学習は、特徴量(例えば、スピード指数、テンの時計、上がりの時計など)さえ指定できれば、あとは、過去のレース結果を教師データとして、機械的にロジックを作成してくれます。そのため、「テン」「上がり」の意味すら分からない場合は厳しいですが、競馬の入門書を1冊読んだ程度で、特徴量は指定できます。

現在、機械学習は、知識がなくても操作できるソフトは未開発で、理系の一部の方が取り組んでいる状況です。本格的な運用となると、基礎数学だけでなく、応用数学も必要ですので、理系でも、一般選抜(旧一般入試)を経て難関大に合格できるような、かなりの高学歴が求められます。しかし、新しい技術のため若い方も多く、競馬の投資経験には乏しい方が大半です。

そのため、ロジックの自動作成に魅力を感じるのだと思いますが、今後5年も経てば、競馬の機械学習が一般化し、ありきたりな特徴量では、同じようなロジックができ、勝てない時代が来ます。そのため、今後、競馬経験者が一気に参入してくると、ロジックの自動作成というよりは、「検証の速さ」に焦点が当たるのではないかと思います。

マネードラゴン馬券塾
マネードラゴン馬券塾

競馬の経験が長い人であれば、互いに譲らない競馬観をすでに持っていますよね。

機械学習への参入障壁は間もなく解除されると思います。すると、競馬観は持っていて当たり前(使用すべき特徴量や、その組み合わせに当たりがつくのは当たり前、ほかのファンが使用しておらず期待値が高い特徴量を知っている人も多い状態)となり、AI予想の本質は、「競馬の経験値」と「検証の速さ」に移ってくるはずです。

競馬の機械学習がソフト化され普及するまでに、馬券投資自体の経験値を上げ、データの速い検証と精査(再現性を見抜く)に慣れておくことがポイントです。

初心者が、今からAI予想に参入するには?

マネードラゴン馬券塾
マネードラゴン馬券塾

競馬のAI予想は、現在は「機械学習のコードが打てる知識」と、予想ロジックの作成機能に焦点が当たっていますが、今後は「競馬の経験値」と「検証の速さ」にシフトしてゆきます。

  • × 機械学習のコードが打てる知識 …もちろんあって邪魔にならないし、IT関係の仕事につながるが、競馬予想に限っては今が価値的にピーク。
  • 〇 競馬の経験値
  • 〇 検証の速さ

初心者がAI競馬に参入するには、企業が公開する「手軽な無料AIアプリ」に登録することや、今から数学や機械学習を学ぶことではなく、競馬の経験値を深めること、計算の速いデータベースを導入することです。

競馬の経験値を深めるには、競馬書籍が一番です。筆者は競馬雑誌なら10年、競馬書籍なら100冊は読んできましたが、競馬雑誌で役立つ記事は2割、競馬書籍なら5割です。

もちろん、ハズレもありますが、総じて書籍の方が質が良いことは多いです。例えば、下の書籍はおすすめです。

競馬雑誌は、現在は『競馬の天才!』が唯一の生き残りで、質は良いです。ただ、直近の的中馬券を根拠に、いかにも儲かりそうに見せる記事の質は微妙で、役立つ記事は5割程度だと思います。

直近では、2023年6月号の「美野真一×田端到対談」が秀逸でした。なかには、ハズレ記事もあるのですが、毎月買うべき雑誌です。

次に、計算の速いデータベースですが、これは有名な「ターゲットフロンティア」で構いません。JRA-VANの有料会員サービスの一環で、月額2090円が必要なのですが、データ更新時のみの加入でも差し支えありません。

ターゲットフロンティアは、初心者は、設定できる特徴量の豊富さに驚くはずです。

例えば芝の重賞をテレビ等で見ていて、枠番別の成績が気になった場合、上のように設定し、期間(過去3年等)を定めるだけです。

枠番着別度数勝率複勝率単回値複回値
1枠52- 31- 41-411/5359.7%23.2%13482
2枠35- 43- 41-439/5586.3%21.3%9676
3枠41- 41- 32-471/5857.0%19.5%6182
4枠37- 42- 46-481/6066.1%20.6%8881
5枠47- 37- 39-511/6347.4%19.4%8974
6枠34- 40- 43-534/6515.2%18.0%5757
7枠49- 52- 50-605/7566.5%20.0%9173
8枠48- 56- 49-624/7776.2%19.7%11784
集計期間:2020. 1. 5 ~ 2022.12.28

すると上のようなデータ1分とかからずに出ます。データを見ると、極端な枠順(1・8枠)の好戦が見られ、接戦となる重賞では、極端な戦法を取らざるを得ない、1・8枠が意外に穴をあけるのではないかと推定できます。

ちょっと注目してほしいのが、「データ1分とかからずに出ます」という部分です。厚生労働省の定義では、AIとは、「大量の知識データに対して、高度な推論を的確に行うことを目指したもの」を意味します。実は、多くの人が使っているターゲットフロンティアは、広い意味では、AI予想の1つと言えるかも知れません。

AIというと、最新の機械学習やディープラーニング、あるいは、分析・推論・問題解決を兼ね備えたものを指し、それ以外をAIでないと断じる風潮もありますが、ここでは競馬に勝つことが主眼であって、AIの定義は問題ではないはずです。

マネードラゴン馬券塾
マネードラゴン馬券塾

競馬新聞をベースとした紙とペンの予想や、ターゲットフロンティアでの経験を経ないで、機械学習に臨む人も多くいます。これは、徳川家康が、地元岡崎での戦いを経験せずに、いきなり武田信玄と戦うようなもの。

実際、表に出てこないだけで、競馬のAIに挑戦したもののモノにならなかった人は多数います。紙とペン、競馬書籍、ターゲットフロンティアのルートは、競馬の世界を制覇するには、必須の道のりとも言えます。

ターゲットフロンティアを扱う期間は、徳川家康の人生で言えば、地元岡崎城で、周囲の小敵と戦う段階です。この時期には、速いデータ集計に慣れると同時に、統計の再現性の見抜き方を身につけます。字数の関係で、詳細は省きますが、「必要な試行回数」「ホールドアウト法」「再現性」辺りがキーワードとなります(筆者のメルマガでは折に触れて解説しています)。

さて、ターゲットフロンティアは、初心者は、設定できる特徴量の豊富さに驚くはずですと先ほど述べました。しかし、中級者になると、今度は設定できる特徴量の少なさや、どのデータも、すでに買い漁られ、期待値が下がっていることに気づきます。この段階になると、データベースを格上げする必要があり、有名なのは「馬王」です。

もし、完全な初心者から始めた場合、「馬王」にたどり着く頃には、競馬の機械学習のソフトが市販されているかも知れません。いずれにせよ、この頃には、年間のプラス決算が視野に入るはずです。

馬王の様子を知るには、馬券裁判の人の本が分かりやすいです。

筆者は、おもに2014年~2022年の9年間をターゲットフロンティアで戦いました。いま思えば少し長く時間をかけすぎましたが、エクセルでの手計算(ターゲットフロンティアの特徴量だけではプラスにしづらいため、独特な特徴量が必要で、それは手計算しかなかった)で、統計や再現性の妙を理解し、レースVTRを何千本と食い入るように見た経験は無駄ではないと思っています。

2023年から、AI予想の段階に移り、1~5月は以下の成績でした。

AI予想 一部手動での見送りを行った予想の成績(本予想)

G1等の手動予想を小額で配信のため、予想件数は多め。

AI予想 手動での見送りを行っていない予想の成績(参考予想)

手動での見送りの失敗があり、本予想では100%に達していませんが、AI指名馬をすべて購入した参考予想では、100%を超えています。

しかし、この期間のロジックには、統計的な誤りがあることが分かり、5月最終週に大掛かりな改善を行いました。6月から1段階上の成績になってゆくはずです。そのプロセスは、メルマガでも発信してゆきます。

筆者のメルマガは、買い目だけを配信するサービスではありません。紙とペンの予想、ターゲットフロンティア、AI予想と上り詰めてゆく「戦国武将」のための「家臣団」として、塾のような機能を持たせています。

AI×未勝利 マネードラゴン馬券塾|VTR観察とデータベースを融合

コメント

タイトルとURLをコピーしました