脳科学・神経科学とデータサイエンス

最新の神経科学・脳科学の研究やビッグデータの医療への応用を誰にでもわかるように説明していきます。

セイバーメトリクスって何? 基本の「き」 その1 ~RE24・得点期待値表~

セイバーメトリクスって何?

基本的には野球を統計学的な視点で解析する学問のことです。
最近では野球を見る人ならば必ず聞いた事がある単語だと思います。
WAR、BABIP、UZRなどといった一昔前であれば
全く聞きなれない単語も一般的になってきたと思います。

セイバーメトリクスの教科書が必要なんじゃない?

最近では掲示板やファンの間の会話でも
これらの単語を耳にする機会が増えてきました。
しかしかなりのケースで誤解している場合が多い気がします。
その理由は各単語の意味はネットで分かってるけど、
算出方法や背景にある考えや前提がわかっていない
と感じこれは教科書的に解説する必要がるのではないか、
と思い米国サイトや日本サイトに書かれている情報を集積、
セイバーメトリクスの入門教科書的な情報を提供します

得点期待値表 創始者ビル・ジェームズ(Bill James)の斬新さ

1977年にビル・ジェームズ「野球抄」という同人誌を出版したのが
セイバーメトリクスの始まりである。
先進的なアメリカと言えど当時は「野球を統計学的な観点から見よう」
という発想は受け入れられず冬の時代が長く続いた。
ビル・ジェームズが発明したものとして最も素晴らしいのは
得点期待値表・RE24(Run Expectanct Matrix)である。

野球は24コマのスゴロクみたいなもの

ビル・ジェームズは野球を24コマのスゴロクだと考えていた。
どういうことか?

野球はベースが3つで走者のいる状態は8パターンある。

走者なし、1塁、2塁、3塁、1・2塁、1・3塁、2・3塁、満塁

そしてアウトは3パターンある。

0死、1死、2死

組み合わせは3x8=24

この24通りの状態を行ったり来たりしながら点が入っていく
スポーツだと彼は考えた。 これはスポーツを科学するという見地からすると非常に都合がいい。
例えば他の団体競技のスポーツを考えて見てほしい。

サッカーで同じことができるか?

20人*1があらゆる速度でピッチ上を動き回り、
ボール自体の状態も場所と速度に加え、高さも考えなくてはいけない。
とてもそれらの配置が24通りの状態しかないとは言えない。*2

どの状態(コマ)がどれくらい点が入りやすいのか?

次に彼はそれぞれの状態になってから
イニング終了までにどれくらいの確立で何点が入るのか?
ということを数シーズンを通し計算した。

具体例:
第一打者:四球
第二打者:バント
第三打者:センター前ヒット、1点追加
第四打者:併殺打

というイニングがあったとすると、
0死→0死1塁→1死2塁→(1点追加)→1死1塁→チェンジ
となる。

【集計結果】
0死   機会+1 得点+1
0死1塁 機会+1 得点+1
1死1塁 機会+1 得点+0
1死2塁 機会+1 得点+1

このように地道に足し算をしていき全部のイニング集計後
得点/機会 = 得点期待値

RE24 得点期待値表

こうした地道の計算のもとに彼は得点期待値表をつくった。

f:id:KJS:20160808104610p:plain

例)
1イニングで得点が入る期待値は0.463
二死満塁からの得点の期待値は0.821

この得点期待値表はあくまで
平均的な投手と平均的な打者が平均的な球場で平均的なボールを使った
という前提です。*3
たとえば記憶に新しい統一球時代は軒並み低い値を叩き出しますし、
近年の神宮でのヤクルトの投手陣に対しての攻撃では高い値を叩き出します。
すごく古い時代と比較する場合は各状態での数値が大きく異なる場合もあります。

例)
用具のせいでほとんど外野に飛ばずHRが出ない
グランドのせいで内野安打多発、内野守備のセオリーが違う

そういう意味ではこの得点期待値表は
このリーグ、この時代では、どのような「野球」が行われているか
を知る大事な一歩でもあります。

得点期待値 ≠ 得点確率

いくつかの状態で1を超えていますから明らかですが、
これらの表はあくまでの期待値であって、得点確率ではありません。
1点以上入る得点確率に関しては違う表を用意しなくてはいけません。

f:id:KJS:20160808113023p:plain

こちらが得点確率の表です。
得点期待値が高ければ、だいたい得点確率もあがっています。
しかし細かく見ていくと違う部分も見えてきます。
一番よい例は1死2・3塁と1死満塁の例です。
1死2・3塁は1死満塁より得点確率が高いですが、
得点期待値は低いです。
これは満塁策がセイバーメトリクス的にも支持される作戦
であることを示しています。*4
繰り返しになりますが、
これらの得点確率も投手や打者、時代と場所により異なります。
これは時代と場所によって取るべき作戦が変わっていくべき、
ということも示唆しているといえます。

次回はRE24・得点期待値を使った打者の真の実力wOBAについて見ていきます。

kjs.hatenadiary.com

*1:GKは除いた

*2:仮に24通りの状態に大別できるにしても、実際のサッカーのプレイ動画からどの状態かを判別するのは少数のグループでは不可能に近い

*3:上記の表は昨シーズンNPBの値を使用しました。

*4:当然、敬遠する打者と次の打者の質にもよるが