厩舎のコメントからキーワード分析する

POGの本には冒頭に厩舎コメントつきの2歳馬の写真ページがあります。

f:id:sanshonoki:20190520232638p:plain:w300

この例で言えば、「厩舎の一番馬ですね。来たときから均整の取れた馬体をしていました。(以下、略)」が厩舎のコメントにあたります。

このコメントからその後の活躍を予感させるサインとなるキーワード、活躍に結びつきにくいサインとなるキーワードを抽出できないかという試みです。

サンプルデータ数が少ないこともあり今回は機械学習や統計のアルゴリズムを使わない人力によるデータ分析です。

データ

過去3年分のPOG本のコメントから分析します。

年度 データ数
2018〜2019年 POGの王道(黄本) 83
2016〜2017年 最強のPOG青本 38
2015〜2016年 最強のPOG青本 49

2017〜2018年のPOG(アーモンドアイ3冠の年)は都合により本を購入しておらず残念ながらデータがありません..

たった3年分でも手打ちによるデータ入力作業があまりにも大変だったので一部の種牡馬ディープインパクトキングカメハメハ + α)に絞ってコメント入力しました。

分析方法

POG期間の獲得賞金のデータを取得し、それをマージしたテーブルを賞金でソートします。 そして目で上位で見かけるキーワードと下位でよく見かけるキーワードを抽出するというものです。

f:id:sanshonoki:20190520233953p:plain皐月賞後時点でのデータ)

ちなみに、賞金等の馬のデータの取得はこちらのお手製のscraperを使っています。

github.com

結果

頑張ってポジティブ(活躍を予感させる)キーワードとネガティブ(活躍に結びつきにくい)キーワードを抽出した結果、次のようになりました。

Positiveキーワード
  • デビューが早い(6~7月、6月東京、6月阪神、夏のデビュー、7月中京、早めの移動)
  • 完成度が高い
  • スタッフの評判が高い、厩舎内で一番、トップクラス
  • 動きが抜群、身体能力が高い、相当良い、すごくいい
  • 我慢が利く
  • 緩くない(ルーラーシップ産駒)
  • 柔らかい(キングカメハメハ産駒)


キーワード 代表例
デビューが早い (たくさん)
完成度が高い グランアレグリア
ダノンファンタジー
スタッフの評判が高い、厩舎内で一番、トップクラス サトノダイヤモンド
アドマイヤジャスタ
動きが抜群、身体能力が高い、相当良い、すごくいい サートゥルナーリア
アルアイン
アドミラブル
クラージュゲリエ
我慢が利く サートゥルナーリア
緩くない(ルーラーシップ産駒) ディアンドル
柔らかい(キングカメハメハ産駒) レイデオロ
リオンディーズ

デビューが早いのは言わずもがなのここ数年のトレンドですね(POGをやる上で逆らえないノーザンファーム系のクラブ馬の傾向) 厩舎コメントがどうだったか分かりませんがアーモンドアイもデビューは夏でした。

デビュー時期以外に関しては、活躍した馬のコメントなのでそりゃそうだろうという内容ですが後で取り上げるNeutralキーワードより重視したいワードとなります。

逆に、上記のコメントがありながらPOG期間で期待ほど奮わなかった馬をリストアップすると、、

  • サトノソロモン:"厩舎の一番馬"
  • プランドラー:"スタッフの評価も高い"

になります。

Negativeキーワード
  • 成長を促しながら、焦らずいく
  • 成長がゆっくり、成長途上
  • 幼さを残す、気性面が幼い、併せるとガツン
  • 小柄、細い、華奢な面がある
  • 非力さがある
  • デビューは秋以降

基本的に完成度が低いということを意味しています。 血統が良くてもこれらのキーワードが含まれているとリスク増ということになります。要注意です。 あとは当然ながら気性が悪いと能力を発揮できないリスクが高まるということですね。

Neutralキーワード

他に、PositiveでもなくNegativeでもない上位の馬でも下位の馬でも見られるNeutralキーワードとして以下がピックアップされました

  • スピードがある
  • バネ、キレがある
  • 乗り味がいい
  • 動きが柔らかい
  • 素質の高さ
  • 期待している
  • 大物感
  • ディープらしさ(ディープインパクト産駒)

乗り手の主観ぽいのはあまり当てにならないということですかね。。


写真ページに掲載される馬はそもそも素質を見込まれた馬たちですがこれらのキーワードを参考にすると活躍馬と出会える確率がより高まると思います。あと、分析作業をやってみた感想として走る馬を見分けるのは難しいが走らない馬を見つけるのはそこまで難しくないという印象を持ちました。 守りを固めるには良い情報になるかなと思います