脳科学・神経科学とデータサイエンス

最新の神経科学・脳科学の研究やビッグデータの医療への応用を誰にでもわかるように説明していきます。

セイバーメトリクスって何? 基本の「き」その2 ~wOBA・打者の真の実力~

打者の真の実力 wOBAとは?

kjs.hatenadiary.co前回はRE24・得点期待値表の話をしました。
今回はその表を使った打者の評価の話をしたいと思います。
打者の評価とはどのような形で行うべきでしょうか?
800本塁打と4000安打はどちらの方が優れた打者だというべきなのでしょう?
そもそも「優れた」というのはどのような定義なのでしょうか?

「優れた」=どれだけチームが得点を挙げるのに貢献したか

セイバーメトリクスの考え方ではプレイヤーの攻撃評価は
どれだけチームが得点を挙げるのに貢献したかと定めました。
と同時にここでいくつかの仮定を導入します。

①「打者が状況によって能力を変えることはない」*1

例)得点圏で打者の能力が大幅にアップすることはない
  大量点差で打者の能力がダウンすることもない

②「同一リーグに属する球団は同等の投手力・守備力を有するものとする」

例)優秀・好調な先発とあたる機会が多く、打率が下がったとは考えない
  山田哲人は防御率がリーグ最低のヤクルト投手陣と戦えないため、本来の打撃能力は数字よりもっと高い、とは考えない*2

③「走者のアシストがあったとは考えない」*3

例)イチローが一塁におり投手が警戒した結果、コントロールを乱し四球
  イチローの好走塁により打者に打点がついた

この3つの仮定によりソロだろうと3ランだろうと、どの投手からだろうと、どんな状況だろうと全ての本塁打は同じ、と打者の評価においては見なされます。他の二塁打や四球などの事象についても同じことが言えます。*4
根底にある考えは

「まぁ平均すればそういうケース・幸運は無視できるでしょう」

ということです。

本塁打や四球の貢献値は得点+得点期待値をどれだけ上げられたか

それぞれの事象がどれも同じと見なせることは前回書きました。
ではそれぞれの事象がどれくらい価値があるのでしょうか?
それに関しては前回話したRE24を使用します。

f:id:KJS:20160808104610p:plain

どれだけそれぞれの事象が得点+得点期待値を上げられたか計算し、事象が平均してどれくらいの価値のあるものなのか評価するのです。
たとえば一言に二塁打といっても得点期待値の変化はいろいろあります。

2死からの2塁打   0.086 -> 0.292     +0.206点
2死満塁からの2塁打 0.821 -> 0.292 + 3得点  +2.471点

かなり大きく違うことが分かります。
シーズン中に起こった全ての二塁打による得点期待値の変化を平均すれば二塁打自体の価値を測れるはずです。これは前述の3つの仮定に基づき全ての二塁打は状況に関わらず等しい価値を持つとしています。この得点+得点期待値の上昇の平均値をの得点価値(Run Value)と呼びましょう。

得点価値表 ~安打や四球のもつ得点+得点期待値の上昇平均値~

f:id:KJS:20160815043852p:plain

※赤字はマイナス

これらの値はRE24から算出したものなので、同様に細かい値は時代やリーグによって異なります。しかし、15%以上値が変わることは稀です。

打者の評価は平均してどれくらい得点価値をあげられたか

打者が1回の打席あたりどれほどの得点価値を上げられたかを示せば、打者の真の実力を評価するのに十分と言えるでしょう。
そこで、まずアウトや三振がだいたい-0.300であることをふまえ、全ての得点価値に+0.300しましょう。
アウトと比べてどれくらい得点価値を上げられたに変換されますね。
そして打数+四死球数で割れば打者の真の実力が分かりますね。

wOBAは「何割で一流と言えるのか・・・?」

しかし、こうして算出された値は今までの指標、打率や出塁率とは全く似ても似つかない指標です。つまり打率であれば3割で一流などという基準がありますが、この新しい指標は「何割で一流と言えるのか・・・?」という疑問を生みました。
そこで考案者は「平均が出塁率と同じように数を掛け算しよう、そうすれば数字の比較がしやすくなる」と考えました。*5
そうして得られた式が以下の図の通りです。 *6

f:id:KJS:20160815050529p:plain

セイバーメトリクスではこのwOBA (weighted on base average)が打者の真の実力の評価と考えているのです。

次回はwOBAを使った他のポジションとの比較の仕方について書きます。

*1:この仮定が本当に正しいかどうかはあとで書きます

*2:実際にはこの効果はあるはずであるが、無視できるとする。ちなみに捕手の盗塁阻止率の場合はこれを考える必要がある。これを通称「福本補正」という。

*3:この仮定が本当に正しいかどうかもあとで書きます

*4:単打は外野への単打と内野安打は分けるべきという考えがあり、実際に分けて計算すると2つの得点価値は異なる。これは経験的にも内野安打より外野への単打の方が走者を次の塁へと進める可能性が高いことから明らかであろう。

*5:正直、出塁率自体に馴染みのない日本では打率に合わせてほしかった、というところですが。

*6:分母に関してはエラーや犠飛・犠打、死球を入れたり入れなかったりします。これエラーや犠飛を打者の選択や実力と考えるか否かという問題に起因します。日本では犠飛に関しては意図的に打つ場面も多いと思われるのでこの分母で個人的にはいいと思っています。