NBA的資料統計非常發達,不誇張地講,只要你能想到的資料,就會有對應的記載。但是在資料為比賽帶來便利的同時,也不可避免地產生了很多問題,有的時候,資料並無法反映真實的比賽情況,甚至會混淆視聽,下面我們就來詳細聊聊,資料統計的利與弊。
▼資料統計三大優點
1、帶來便利
現在觀看NBA比賽,基礎資料幾乎成為不可分割的一部分。所謂基礎資料就是指未經過二次計算,直接統計比賽中的得分、籃板、助攻等各項指標,是最直觀的資料,也是應用最廣泛的資料。
很多球迷沒時間看直播比賽,經常會直接開啟比賽的資料統計表,以此來判斷球員表現好壞;或者是看比賽過程中,隨時關注資料變化。這就給大家帶來了觀賽便利,可以第一時間透過客觀資訊來完善觀賽感受,加強對比賽的認知。
2、詳細記載
如果一名球迷對NBA有充分的興趣,如何瞭解以前的球員呢?最常用的方法就是影片集錦和資料統計。但是僅憑集錦只能獲取片面資訊,只有資料統計才能更清晰、更完整地反映曾經的比賽狀況和球員表現。
NBA有龐大的資料庫,幾十年前的比賽統計、球員資料都有詳細的記載,這樣一來,可以讓球迷們最快速地瞭解和熟悉NBA的歷史。
3、適合推廣
除了基礎比賽資料,NBA還有每一年詳細的獎項獲得統計,拿MVP為例,只要你想查,當賽季的完整投票計數都能看到,這就給球員排名提供了客觀依據。
正所謂“文無第一,武無第二”,競技體育的魅力就是競爭、比較。球迷不僅喜歡看比賽中的激烈對抗,更喜歡對知名球星誰強誰弱展開討論。
而NBA的榮譽統計和資料統計,就提供了相對客觀的平臺,讓球星強弱這個本來很主觀很難找到統計論據的話題,有了相對客觀的條件基礎。
而球迷在尋找論據的過程中,就是查詢資料的過程,這樣一來,無形中對NBA的歷史就有了印象,NBA就這樣不知不覺間,完成了對聯賽歷史的推廣。
▼資料統計存在的問題
資料統計有很多好處,但是也存在很多問題,而且有些是極為隱蔽,很容易讓人陷入誤區的大問題。
1、基礎資料的侷限性
基礎資料也就是我們通常看到的得分、籃板、助攻、搶斷、蓋帽、失誤等統計,正如前面提到的,這些統計能幫助觀眾更清晰地觀看比賽,但也存在侷限性。
這個侷限性就是,當資料被剝離到比賽之外,其反映出的現象就和事實有偏差,再通俗一點說,就是一旦只看資料不看比賽,很容易得出錯誤的比賽認知。
比如一場比賽中,同樣的得分資料,高強度防守下挺身而出,和低強度防守下零敲碎打是不一樣的價值,但是基礎資料無法體現區別;
同樣的籃板球資料,在人群中搶籃板或者卡位保護籃板和待在籃下撿籃板,也是完全不同的價值,但資料上也無法分辨;
同樣的搶斷資料,是憑藉身體強度給對手壓迫造成對方失誤,還是孤注一擲地放棄防守位置撲出去,對球隊來說也是不同的,基礎資料同樣一概而論。
所以在當代籃球比賽中,在資料統計越來越被大家重視的情況下,有一些“聰明”的球員或明或暗、或多或少地在場上“刷資料”。
本來一個難度不大的後場籃板,給誰都是給,但有些球員偏偏要和自家隊友爭一下,這樣從資料統計上判斷,他的籃板球能力貌似很強。
再比如有些反擊快攻的輕鬆得分機會,有些球員總是第一時間衝上去,不惜體力也要拿下這兩分,這樣一來,從資料統計上既能拉高場均得分,又能提高進攻效率,這會讓大家覺得他是一名高效的得分手。
2、高階資料的線性問題
很多球迷會被“高階”兩個字嚇住,以為高階就是代表高深,進而把這些統計當成金科玉律甚至是真理一般對待。但事實上,如果你稍微花一點時間瞭解一下,就能發現所謂的高階資料名不副實。
高階資料的原材料全部來源於基礎資料,透過給得分、籃板、助攻、蓋帽、搶斷、失誤、出手次數、命中次數這些基礎統計賦予不同的權重,利用公式計算得出。
這樣一來就存在兩個關鍵問題:
第一,加權引數如何保證精準?實際上這個問題是沒有答案的,因為根本解決不了。雖然大型體育媒體ESPN有不少資料專家,儘可能利用統計學去賦予相對準確的加權,但NBA的比賽是動態發展的。
不同年代比賽強度不同,節奏不同,60年代搶一個籃板和90年代搶一個籃板,是完全不同的價值,但是在計算公式中,這樣的變化根本無法體現。這也就引出了第二個問題,基礎資料的侷限性。
這個問題前文已經提到,如果一名球員去刷資料,體現在基礎資料上就是更好看,而高階資料來源於基礎資料,所以刷得分、刷籃板、刷助攻同樣能讓自己的高階資料好看,一個人為能控制高低的評價標準,還有多少權威性?
第三,則是更深層的問題,那就是高階資料的線性侷限。
比如A球員場均出戰30分鐘,場均出手15次,打出一組資料後透過加權計算,得出其進攻效率是25;另一位B球員場均出戰36分鐘,場均出手20次,計算出進攻效率是20。如果按效率值判斷,A無疑是進攻效率更高的球員。
接下來就涉及到很多球迷的經典問題,是不是給普通球員足夠的出手機會,也能打出全明星的表現?當然不是!在實戰中,對於任何一名球員,一定存在某一個自身能力上限的臨界點或拐點。
拿進攻為例,我們看到某一名球員可以高效地場均貢獻20分,但如果強行要求他更多次出手,完成更多高難度攻堅,他的命中率會出現斷崖式下跌,從0分到20分他需要用15次投籃機會,但是漲到25分,就可能要出手25次才行。
但是高階資料的線性特徵就不能反映出這裡的差異,在直角座標系上,高階資料永遠是一條平穩上升的直線,這種邏輯下,讓A球員不斷增加出手,場均得分會穩步提升,且效率值不變。但是實際中,這種操作在座標系中應該是一條曲線,到了一名球員身體、能力承受上限的拐點,其效率值會暴跌。
對於不同目標的球隊來說,雖然A球員進攻效率高,但是不一定價值就高於B球員。比如一支爭冠球隊,已經有很多得分點,就缺一個執行高難度攻堅的得分手,那麼B球員對於他們來說,才是最需要的,如果引進看似進攻高效的A球員,他們距離奪冠永遠都會差那麼一段距離。
▼資料統計的盲區
除了上述的各種侷限性,資料統計還存在很多盲區。
1、進攻資料的盲區
比如在進攻端,有些“聰明”的球員會挑選輕鬆得分的機會,把那些相對困難的出手留給隊友,這樣一來,自己的得分和命中率都能得到保證。
也許有球迷很說,挑選輕鬆的得分機會也是一種能力,而且說明進攻選擇合理。但是不要忘了從比賽整體角度出發,一場比賽中,一支球隊所有的出手,一定是由簡單、中等、困難等不同級別的出手組成。
作為球星,價值的體現就是去完成那些困難的出手,把簡單的出手留給角色球員,但如果一名球星反過來,總是搶著出手簡單的投籃,反而把困難的投籃留給隊友,這樣得來的高效資料,又有何意義呢?
2、防守資料的盲區
再比如防守端,這其實是資料統計最大的盲區。目前防守效率主要參考還是看蓋帽、搶斷這些基礎資料,先進一點,再加上限制對位球員命中率和對位得分正負值等。
但這些資料統計都只能片面地體現防守能力,實戰價值更高的身體對抗、無球跟防,協防補位等多個層面,資料根本無法體現。
因此NBA中有一些球星,在這些資料統計無法體現的防守環節上,體能是能省就省,而在籃板、蓋帽、搶斷上,拼著防守失位也要去爭取。
這種本末倒置的球風,往往會得到不錯的防守效率,反而是那些不惜體能,在防守端用身體去消耗對手的球員,最終的防守效率不怎麼好看。而實際上,後者才是防守大閘,前者可能是防守黑洞。
▼資料統計的不可替代性
最後我們要問,為什麼明知道資料統計存在這麼多漏洞,大家還都以此為評價依據呢?答案其實很簡單,因為NBA比賽太多看不過來。
這不是在開玩笑,NBA一年的常規賽總場次高達1230場,加上季後賽就更多,別說普遍的球迷,就是以NBA為生的職業記者、評論員也不可能關注全部比賽,或者說大家都只能觀看一小部分比賽。
但是基於職業要求,對NBA的解說、報道、分析、評獎等多方面,還需要評論員和記者們去完成,這樣一來,他們只能透過資料統計,來衡量所有球員之間的強弱對比。
而對於球迷來說,更是需要用資料來驗證自己的觀點,因為作為業餘愛好者,別說比賽,集錦都看不過來。
但資料畢竟是為人服務的,NBA的資料統計也是比賽的輔助環節,絕不是用來給比賽和球員定性的。如果完全迷信資料統計,把這些數字和公式當成真理,最後不僅會遠離比賽的真實情況,也失去了欣賞體育比賽原本的魅力。