看棒球只看打擊率,代表你是外行人!內行人會看這兩個數據:得分相關性高達0.9

2024-06-17 10:40

? 人氣

不過打擊率的罪過還不只是選擇性忽視而已。打擊率的分子部分還有你所不知的缺陷,主要是這個完全由安打數構成的分子對所有的安打都一視同仁,不論你是一壘安打還是全壘打,在打擊率的計算中都有著一樣的權重,即使我們都知道一壘安打跟全壘打在比賽中的分量有多麼不同。

[啟動LINE推播] 每日重大新聞通知

所以關於打者在某段時間內的表現,打擊率實際上告訴了我們什麼?它告訴了我們打者在沒被四壞保送、沒被觸身保送、沒打出高飛犧牲打或犧牲短打,乃至於沒發生其他不計打數的罕見狀況時,其剩下的打席數有多常打出安打;它只告訴了我們打者打出了一些安打,但沒告訴我們他都打了些什麼樣的安打。(所以才會有那句,當打者靠著軟弱內野安打上到一壘後聽到的棒球金句:「鳥安也是安打。」)這明明是個不好的傳統,但卻在糾纏我們長達一百多年後,仍舊在我們討論跟評價打者時帶有其不該帶有的重要性,尤其是我們會因此高估聯盟打擊率的領先者,只因為我們會說他們「贏得了」某種頭銜。我們容易受到混淆,是因為高打擊率的打者普遍來講也是好打者,這點無庸置疑;我們從打擊率處獲得的並不都是假訊息,但我們會受到打擊率之假精度的誤導,我們會以為打擊率精準到小數點後面三位數,就足以讓我們總結出對某個球員的判斷。而想完整了解打擊率的缺陷大到什麼程度,我們可以將之拿來跟其他更完備的數據比較。

我會常在這本書裡用上的一個基本統計工具,名為相關分析(correlation analysis),意思是我會把兩欄資料放在一起對比,然後得出一個數字在零與一之間,重點是這個數字會讓我們知道這兩欄資料的相關性強弱,而讀者可以將之理解為這兩欄資料亦步亦趨的程度高低,零代表兩欄資料毫無相關性,一則代表兩欄資料完美相關。基本上這個數字愈大,兩組數據的相關性就愈強,意即當A數據變動時,B數據也會跟著變動。但這並不代表A造成了B或B引發了A;你應該聽人說過「相關性並不能證明因果關係」,因為相關分析能夠告訴我們的,只是兩組統計數據間看不看得出某種關係。兩組數據之間的相關性背後可能是直接的因果,也可能純屬巧合,但總之這項工具能讓我們知道的,就只有兩個數據亦步亦趨的程度高低。在本書裡,我會經常在提及兩組數據的相關性時表示是其中一個數據「預測」了另外一個。

在下表中,我使用了大聯盟球隊在2011到2015年這5個球季中的統計數據來展示兩樣東西的相關性,一樣是整隊的四種常用打者比率數據,另一樣則是這些球隊的單場平均得分。

打擊率、上壘率、長打率、整體攻擊指數與團隊單場平均得分的相關性(圖/八旗文化)
打擊率、上壘率、長打率、整體攻擊指數與團隊單場平均得分的相關性(圖/八旗文化)

打擊率與團隊得分的相關性不算低,大概有0.750。雖然這不能顯示因果關係,但我們仍可以合理期待當一支球隊在其(沒什麼邏輯的狹義)打數中累積愈多安打,其團隊得分就會愈高。但凡事都是相對的,打擊率並不算差的表現還是輸給了另外兩種常用的打者評價數據:上壘率與長打率。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章