2018-2019年度POG用の2歳馬リストを作る

先日作ったスクリプトで自分でも2歳馬リストが作れることが分かったので作ってみました。

方法
  1. 必要なデータをスクリプトで取得

    $ python get_horse_data.py --age 2 -o pog2018_1.csv --include_no_debut
    $ python get_horse_additional_data.py -i pog2018_1.csv -o pog2018_2.csv
    
  2. 2つのファイルをマージする

     import pandas as pd
    
     df1 = pd.read_csv("pog2018_1.csv")
     df2 = pd.read_csv("pog2018_2.csv")
    
     df = pd.merge(df1, df2, on='id')
    
     # 不要なカラムを削除
     df.drop(['birth_year', 'trainer_id', 'owner_id', 'breeder_id', 'prize', 'name_y', 'race_result'], axis=1, inplace=True)
     df.drop(df.loc[:, df.columns.str.contains('^Unnamed')], inplace=True, axis=1)
    
     df.to_csv("pog2018_list.csv")
    
出力項目
  • id
  • 馬名
  • 性別
  • 厩舎
  • 母父
  • オーナー
  • 生産者
  • 毛色
  • 生年月日
  • セリ価格
  • 近親馬

以下のサイトで2歳馬リストがダウンロードできますがセルフで作ってみたいという方はやってみてください。。 (スクリプトの拡張大歓迎)