重賞の過去10年分のデータによる予想の「大嘘」

GⅠチャンピオンズカップ コースの傾向は? 中京ダート1800mの特徴、有利な馬や枠順、得意な騎手は?

競馬予想において投資するレースを選び、投資する馬、馬券の種類、投資額、そういったものを決めていく仕組みを「ロジック」と言います。しかし、「競馬予想ロジック」というのは多種多様で、ニセモノに騙されてはいけません。

画像 009

重賞の過去10年分のデータによる予想の「大嘘」

20秒で作れるロジックもある

競馬というのは未来を予想する行為ですが、未来はまだ来ていないのですから当面過去のレースを分析してロジックを作っていくほかありません。例えば、ある日1日の競馬だけでもロジックは作れます。その日の競馬を見て、例えば「芝では、先行でき前走が4~5番人気だった馬を軸にすると、単勝回収率が200%になる」などです。

そんなのその日に当てはまるだけでロジックでないとおっしゃると思います。

それならば4週間ではどうですか?過去4週間の競馬を見てできあがったものが、今後も当たるロジックなのでしょうか?あるいは1年間、3年間、10年間。どの程度の期間を見れば万全だと思われますか?

重賞の過去10年分のデータによる予想の「大嘘」

実は1年間でも、3年間でも、10年間でもあまり関係ないのです。お気づきのように、期間より数が大切です。同じ10年間でも「未勝利戦ダート」という範囲であれば相当数の分母ですのでロジックが作成できるはずです。

しかし、重賞というとわずか10レース。つまり先ほど例に挙げた1日の競馬を見て何か結論を出すのと全く同じレベルなのです。対象が10レース程度なら、統計的には意味が全くありませんし、最適化と言って回収率がつり上がるような調整もすぐに出来てしまいます。

よく競馬雑誌で重賞の過去10年くらいのデータを検討し、しかも「さらに当日の馬体重減が8キロ以内なら複勝率は100%に」などという、最適化もここまでやるかという記事に出くわします。統計分母10で何を言うのか、逝ってこいよという感じです。

ロジックとは単なる統計操作なのか

「さらに当日の馬体重減が8キロ以内なら複勝率は100%に」という記事が掲載される。その途端に、得てして10キロ減の馬が勝ったりします。

これは馬体減が8キロ以内であることを確かに支える真理がないからです。ちょっと難しい話になりますが、本来ロジックというのは検討対象のデータそのものに根拠を求めるのは本末転倒なのです。

だって、トートロジー(同義反復:あることの根拠が当のあることに含まれており論理が循環していること)じゃないですか!

ロジックというのは一見統計分析のようですが、実は競馬観を背景にした数字の操作になっています。やはり生産者から他の競馬ファンの動きまで、余すところなく競馬を知ることでしか見いだせないと思います。

ロジックを作成するときに過去のデータからの類推ももちろんするのですが、それよりも経験的にこれこそが真理だろうと考えることや、プロ級の競馬分析者が真理として主張するファクターのみからシンプルなロジックを作っていくのがいいと思います。

もちろん多数のレースを統計母数として出てきた事柄は慎重に検討し、しっかりと理由を探っていき新たな真理の発見にも努めますが、どうしても理由の説明が不可能で不自然なものはできればカットします。そうなれば最適化でなく、長く使えるロジックが出来上がるはずです。

少ない統計分母に対し、「馬体重が」「斤量が」などといろいろ条件をつけて回収率が出るようにしたロジックは、対象のデータに当てはまるように最適化(=後付け)して作られたものに過ぎず、長い間再現していくものではないということです。

まとめ
・分母が少なく、必死で最適化してあるロジックはゴミ同然
・ターゲットフロンティアを何千回いじっても、競馬観がないならば何も見つけられない

GⅠチャンピオンズカップ コースの傾向は? 中京ダート1800mの特徴、有利な馬や枠順、得意な騎手は?

コメント

タイトルとURLをコピーしました