當前位置 > 首頁 > 專家訪談 > 足球的大數據分析: 訪談Dustin Bottger

广西快三什么时候开售:足球的大數據分析: 訪談Dustin Bottger

广西快三专家推荐号 www.otukai.com.cn 來源:中國數據分析行業網 | 時間:2015-09-24 | 作者:數據委

全球足球網絡的主要目標在于徹底變革現代球探網絡運行模式。在邁克-劉易斯(Michael Lewis)的全球暢銷作品《點球成金》(改編自邁克-劉易斯的《魔球:逆境中的智慧》,電影講述了奧蘭克運動家棒球隊總經理比利-比恩的經營哲學,描寫了他如何以小博大、力抗其他薪資總額比他們多上數倍的大球隊的方法)的影響下,足球人一直致力于考量對于職業足球更加有效的探查并且基于此創造一套獨特的評分系統(GSN-Index:全球足球網絡指數)的可能性。

Q:從數據分析的觀點,您在面對收集數據時經?;崦娑閱男├??

A:最大的問題在于,我們需要從所有相關的比賽中持續收集有價值的數據。我們必須保證數據庫中的每名球員都有同樣數量的比賽數據,唯有如此,我們的體系才會有意義。因為我們和很多家數據公司以及足球分析專家建立有合作關系,所以我們完全不用擔心數據的收集問題。

Q:請給我們提供關于GSN指數以及它的運作方式的更多的細節。這個系統需要考慮什么?有哪些獨到之處?

A:我們想創造一套世界上最具全面性的球員評估系統。所以我們開發了GSN指數,這個指數由四大支柱系統組成。這是對于這四個系統的一個簡單的描述:

1.足球相關特性(SRC):GSN指數的基礎是評估以及數據化對于球員來說至關重要的相關特性(70項以上)。為了盡可能達到客觀公正,每名球員將會分別對數名不同的球探近距離考察。評估包括技術能力、戰術理解力、精神屬性以及身體素質四大方面,這四方面將最終綜合為0-100的總分。然而沒有任何一名球員能達到100分的滿分。最終的評分將經由一套考慮到球員位置屬性的復雜計算得出。相比于前鋒,一名中后衛需要不同的能力,而我們的系統將自動將這方面的差異納入計算過程。對于所有在我們數據庫中球員的評估將根據我們的全球球探系統定期升級。

2.潛力值:這將是各俱樂部購買球員時最看重的因素之一,同時怎樣在這一方面有所提高也是我們未來工作的重心。甚至在今天,各俱樂部會為了一些年輕球員和天才少年一擲千金。所以,能否在其職業生涯早期認識到一名年輕球員的潛力就變得格外重要,這將有利于球隊利用合同條款趁早占有這些未來之星。

GSN開發出了一個基于改進過的的經濟和財政運算法則之上的系統。許多因素將被列為能夠影響球員發展軌跡的關鍵要素從而被考慮進去,例如教練的水平和足球教育水平的高低、學習能力、年齡等等。起始分數為0.00分(沒有任何潛力可挖)。數值可以一直到達滿分。數值越高,潛力越大。

3.+/-值:+/-值是GSN指數四大支柱系統中的第三個系統。根據球員們在球場上的實際表現,他們的分數會因為積極的表現得到提高(進球、助攻、點球撲救、傳球成功率等等),同理,球員們的分數也因為消極的表現遭到削減(烏龍球、紅牌、傳球失誤等等)。數值100代表著一個平衡的+/-數值,即沒有加分也沒有減分。如果數值超過了100,這代表著這名球員的積極表現超過了消極表現。同理,如果一名球員的得分低于100,那么他在場上的消極表現多過了積極表現。當然,數據也同樣會考慮到球員的位置問題。同樣的進攻行為,防守球員和進攻球員的評分會有所差異。

4.比賽水平:比賽水平是GSN指數中最后一個但同樣很重要的一項。在這個系統下,我們有能力分析以及評估在一名球員的職業生涯中的每一場比賽。每場比賽的分數都介于1到20之間。20分代表世界杯決賽或者歐洲冠軍聯賽決賽,而1分則多代表一些青年級別聯賽以及業余比賽。這個系統也會根據球員年齡以及上場時間進行調整,比如一名19歲的球員在德甲聯賽中踢滿了90分鐘,他會比一名30歲并且踢滿90分鐘德甲比賽的球員得分更高。比賽水平越高,GSN指數便會更高。

同時我們也使用夏普利值(譯注:夏普利值指所得與自己的貢獻相等,是一種分配方式),它能幫助我們顯示一名球員在多大程度上影響了比賽。由以上四個支柱系統得出的最終數值形成了GSN指數。

就像我們上面提到的,這是一個全世界最全面的球探系統。我們的系統把來自不同聯賽、國家、賽事以及年齡層的球員的比較變成了現實。這套系統也使得各俱樂部負責轉會的決策者更加有??裳?,他們能更加便捷的分辨哪些球員是被低估的,而哪些球員則名不副實。我們能夠對全世界超過340000名球員進行評分。我們也有能力創造一個價格-表現比率,這個比率顯示了一名球員是否物有所值。這完全符合點球成金式的足球風格。

Q:現如今鋒線球員的數據能夠輕易反映其場上表現,然而這套系統在反映防守球員表現的相關數據分析以及評定方面有任何提高么?

A:球場上發生的每一個細節都被我們詳細記錄以及保存了下來,包括防守行為中的鏟斷、攔截以及頭球等等。現在我們也能夠通過數據觀察哪名球員應該對失球負責或者與之類似的重大失誤。我們將這些場上行為轉換成與失球相關的數值。不僅僅是傳球成功率,犯規、助攻以及其他與進攻相關的指標都可以作為我們評估一名防守球員優劣的標準。

Q:你能更深入地介紹一下記錄以及評估球員的這套參數么?當你們跟蹤觀察一名球員時,為什么一些特定的參數的比重會壓過其他一些更顯而易見的參數呢?你們在參考這些參數的時候,有沒有刻意的強調其中某些參數呢?

A:我們會盡可能地對一名球員的全部信息加以搜索(因特網、報紙、雜志、電視節目等等)。比賽報告、傷病報告、比賽數據等等,還有我們的球探報告。把所有這些信息匯總成一個GSN指數是一項浩大的工程。

在如此眾多的信息中,比賽數據對我們來說最為重要。我們的計算公式會引入每場比賽的每一個場上事件作為計算+/-值的基礎。特別是場上那些關鍵參數(進球和助攻無疑最為顯著)將比其他的參數更具說服力。至于其他的,涉及到公司商業秘密,恕我無可奉告。

Q:現在所有人都在關注足球場上的數據分析,行業內的先行者們早已表明統計(stats)和度量(metrics)指標是完全不同的。你能給我們更深層次的探討一下這個命題么?

A:指標表示的是一種能告知我們有關事物發展變化的信息的數字。在這里,GSN指數就是一個指標。一個指標有其自身所代表的意義,并且有一套得出它的計算流程,我們可以清楚地定義指標并且精確地將其計算出來。參考指標具有十分重大的意義,它能便于我們觀察事物的發展趨勢,并且可以將不同時期的度量指標放在一起橫向比較,因為我們早已知道他們是按照相同的方法計算出來的。

而統計只是一些原始的數據,他們被直接用來觀測和判斷,統計數據將被用來計算度量指標。

Q:根據你的經驗或是認識,全球范圍內,哪些俱樂部在利用數據分析方面做得最為出色呢?

A:我認為是米迪蘭特隊(丹麥)和布倫特福德隊(英格蘭)。馬修-本漢姆(Matthew Benham)和拉斯姆斯-阿科爾森(Rasnys Ankersen)是數據分析的先驅,并且他們借此徹底改革了兩隊的球探部門。

阿爾克馬爾現在處于比利-比恩(Billy Beane)(譯注:前美國職業棒球大聯盟奧克蘭運動家隊總經理,其新奇的球隊管理經營方式也因作家麥克-路易士的《魔球——逆境中制勝的智慧》一書而聞名,該書于2011年改編為電影《點球成金》)的領導下,也逐步走上了正確的道路。

另外我還想提一下幾支大聯盟球隊,比如新英格蘭革命隊、堪薩斯城競技隊或者多倫多FC隊。他們經常在以數據為主導的體育賽事上經行分析,例如籃球、美式足球(橄欖球)以及冰球,并且經常能夠引入創新的并且很有見地的分析方法。很顯然,小球隊會試著用數據分析來創造競爭優勢。

Q:有沒有這樣一種球員,他們并不被人熟知,然而根據你們的數據分析模型,他們完全有資格得到更多的認可與更高的評價?

A:有一些球員被嚴重低估了,而也有一些球員被高估了。米迪蘭特隊的丹麥年輕黑人邊鋒皮奧奈-西斯托(Pione Sisto)是個名副其實的數據狂人?;諼頤塹腉SN指數模型,他已經達到世界級水準了,然而在丹麥以外,沒有人注意到這一點。除了他,還有很多這樣的球員。

Q:我們了解到這個創意很大程度上來源于《點球成金》這部電影,然而相比于像棒球這種非連續性的比賽類型,在連續性很強的足球比賽中持續的進行數據分析有多大的難度?

A:我聽說過,也讀到過這種說法很多很多次,但是說實話,我不明白這是什么意思。如今球場上發生的一切都在被記錄著、分析著?;蛐磯雜詘羥蚶此?,記錄一整場足球比賽要更加困難一些,不過如果更加專心地跟進關鍵指標并在合適的比賽背景下正確地分析它們,你將不會在分析足球比賽數據上遇到任何問題。數據分析的反對者們只選擇相信自己的雙眼所見,而爭論仍將繼續進行下去。

Q:在數據分析正在被廣泛應用的當今足壇,你們遇到的最大挑戰有哪些?

A:最大的挑戰在于俱樂部決策人的心態。他們中的很多人擔心數字化會使他們丟掉工作,這絕對是錯誤的。沒有具備了經驗和專業知識的管理人員,數字化就無從談起。如果沒有我們合格的長期工作在全球各個角落的專業球探,我們的網站就無法提供內容翔實可靠的GSN指數。

當使用我們的系統時,球隊不應該更換經理、教練、體育主管或是球探,相反,我們的產品應該為他們所用并幫助他們提高工作效率。我們給俱樂部的建議很簡單:接受新技術,采用新的思維方式,把這些先進的思想介紹給你們經驗豐富的雇員。

Q:一些專業足球數據分析網站,比如Squawka.com和WhoScored.com給足球發燒友們提供了免費的數據。這些網站所展示的數據和俱樂部所使用的數據有什么不同么?

A:首先我必須得說Squawka.com和WhoScored.com都是非常好的網站。他們提供的數據和俱樂部實際使用的數據的差異很難說清,因為各俱樂部側重點不同。一般情況下俱樂部傾向于掌握更多聯賽、國家以及各級賽事的數據。Squawka.com和WhoScored.com只覆蓋了和他們的球探切實相關的聯賽和球員的數據。俱樂部同時也會從他們內部的醫療部門以及訓練場上得到其他人得不到的數據。

Q:即便是數據分析能夠將體育更深層次的東西以數字的形式展示出來,然而這種形式的量化仍然不能像傳統的球探跟蹤的方式那樣將球員的身體以及技術能力全方位的表達出來。單純的數字分析將有可能因為一組不完整的數據而忽略了一名球員真實的身體或是技術能力。你認為這個說法有道理么?

A:絕對不是這樣!如果你擁有富有經驗且知識淵博的球探以及精細的數據表格,你完全有可能將一名球員的身體或技術能力通過數字的形式表達出來。GSN數據庫中的每一名球員都在被不同的球探在獨立的基礎上定期跟蹤觀察。他們的報告內容將被轉化為數字的形式。這種建立在常規基礎上的方式將最大限度地保證客觀性。通過這種方式,我們將得到有關多重屬性的精準的數字。

Q:最后,一個傳統疑問,數字會說慌么?

A:數字最終不能百分之百地反映一個球員的各種屬性,但是可以非常接近。對于球員以及球隊的真實情況的每一個百分比的精確認知都將使我們在成功的道路上邁出重要一步。

翻譯轉載自//outsideoftheboot.com/2015/09/24/insight-into-data-analysis-in-football/