« 【予想】0207【☆】【燕】 | トップページ | 【結果]0206.07【☆】【燕】【h2021】 »

2021年2月 9日 (火)

サンプル数にこだわる人間にプロはいない

■サンプル数にこだわる人間にプロはいない 土方吾郎



「サンプル数が少ないデータは信頼性に欠ける」

こんなセリフを口にする方をよく見かけるが、この考え方は、はっきり言ってデータ派失格だ。本当に勝っている人間なら、サンプル数の多さと信頼度は比例しないことを理解している。たしかに、データの特性を知るために、ある程度のサンプル数は必要ではある。

だが、データというのは、あくまでも過去の事象の集合体。サンプル数が多いからと言って、これから起こることを的確に予想できるものではない。競馬は様々な条件が絡み合い、結果(着順)が出るものである。常に一定の条件下で出目が決まるものと同じように考えるべきでない。

たとえばサイコロ。サイコロの出目の統計を取った場合、回数を重ねるほど確率は均等(6分の1)になる。だからサンプルはたくさんあった方が正確なデータが得られる(真実に近づいていく)という考え方は正しいのだが、競馬はサイコロと決定的違う。レースの構造が逐一変化しているからだ。

過去の事象から未来を予測するしかないという先の主張からは矛盾してしまうかもしれないが、競馬では同じ現象は二度と起こらない。
例えば一流ジョッキーは馬場を歩き、午前中のレースに乗り、レースVTRを見るだけでも、その日の馬場の特性をつかむことができ、それを午後8メイン)の騎乗に活かす。また、単純に午前と同じような特徴とは考えず、午前のレースから午後のレースではどう乗るべきかといったことも想像できる。午前のたった1レースが、午後のレースにとってはサンプルともいえるわけだ。予想も同様である。

過去のデータとは、あくまで構造を理解するためのものであり、プロであればこそ、少ない事象(サンプル数)で構造(レースコースの特徴)や将来の動向を理解、推理できるのだ。少ないサンプルで構造や将来の動向を理解、推理するには、経験は必要かもしれないが、構造を理解するためには、サンプル数の多さはそれほど重要ではないということだ。

「データとは構造を理解するために重要」なのだ。「データはサンプル数が命」という大きな勘違いをしていた方は特に、そこを強く認識していただきたい。

 

 

« 【予想】0207【☆】【燕】 | トップページ | 【結果]0206.07【☆】【燕】【h2021】 »

目から鱗の馬券学」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« 【予想】0207【☆】【燕】 | トップページ | 【結果]0206.07【☆】【燕】【h2021】 »

フォト

天気予報

2021年4月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

オッズ


CAT


最近のトラックバック

オッズ

無料ブログはココログ

チャットルーム