Mecze piłkarskie można oglądać w Excelu. Nie widać tam wprawdzie kolorów koszulek, ale widać, co się stało z piłką dziesięć sekund po tym, jak Vladislavs Gutkovskis podjął próbę pressingu. I jak często Patryk Kun wbiega z piłką z drugiej do trzeciej tercji. Paweł Kapuściński, analityk danych, stara się z morza liczb wyłowić przewagę konkurencyjną dla wicemistrzów Polski.
Paweł Kapuściński niewiele książek trzyma na półce. Większość czyta w formie e-wydań. Ale dla jednej robi wyjątek. - “Moneyball” Michaela Lewisa jeździ za mną wszędzie, gdzie się przeprowadzam. Przeczytałem ją kilka razy i uważam, że jest w niej bardzo dużo informacji o tym, co robić, a czego nie, gdy się chce w klubie pracować z danymi — mówi. - To dobry punkt wyjścia, żeby zrozumieć na podstawie relacji międzyludzkich, sposobów komunikacji, doboru ludzi, jak sprawić, żeby to działało. Uważam, że zarówno książka, jak i film są bardzo ciekawe. W ogóle książki Lewisa to dobry podręcznik dla zainteresowanych tym tematem. Pokazują, jak ludzie podejmują decyzje i dlaczego nie myślą statystycznie – dodaje. Nie potwierdza więc moich przypuszczeń, że ludzie z jego branży mają już dość słuchania o “Moneyballu”. Książka Lewisa im także musi działać na wyobraźnię.
Kapuściński od października pełni funkcję analityka danych w Rakowie Częstochowa. Przyszedł razem z Robertem Grafem, nowym dyrektorem sportowym, z którym pracował wcześniej w Warcie Poznań. Jest jedną z nielicznych osób zatrudnionych w ekstraklasie na takim stanowisku. Jego obecność w polskim futbolu zrodziła się ze złości na panujący w kraju brak zrozumienia dla statystycznego spojrzenia na futbol. - Na którejś ze stron ktoś napisał kiedyś artykuł na temat tego, czy w Polsce jest możliwa analityka piłkarska. Były w nim wypowiedzi paru osób ze środowiska, m.in. skautów różnych klubów. Jeden z nich stwierdził, że nie jest możliwe odróżnić w statystykach przypadkowe wybicie do przodu od długiego podania do środkowego pomocnika, który ma rozgrywać piłkę. Potraktowałem to emocjonalnie i napisałem do niego na LinkedInie, wyjaśniając, że to jest możliwe, tylko trzeba mieć do tego odpowiednie narzędzia, które wcale nie są takie drogie, a na pewno znajdują się w zasięgu wszystkich klubów ekstraklasy. Chodziło mi o StatsBomb czy Optę. Wymieniliśmy kilka wiadomości, przesłałem mu nawet sporządzoną przeze mnie analizę, ale kontakt się urwał. Zacząłem jednak odzywać się z tą analizą do różnych polskich klubów, oferując usługi i podkreślając, że jako iż mam pracę poza piłką, która pozwala mi dobrze zarabiać, nie oczekuję tak naprawdę niczego poza dostępem do danych - wspomina.
Na jego ofertę odpowiedziały dwa kluby. Jednym z nich była Warta Poznań. - Robert Graf umówił się ze mną na spotkanie, rozmawialiśmy o StatsBomb i o tym, dlaczego to najlepsze narzędzie do pracy z danymi. Robert na to przystał. Nie miałem żadnych warunków finansowych, umówiliśmy się jedynie na pieniądze, których zadaniem było sprawienie, że czułbym się winny, gdybym nic nie robił. W ten sposób w lutym zaczęliśmy wspólnie działać — opowiada. Pierwsza praca w polskiej piłce nie była jednak jego pierwszym kontaktem z zawodowym futbolem, bo już wcześniej przez dwa lata pracował jako analityk danych w Burnley. Dostał się tam w dużej mierze przypadkiem. - Pisałem kiedyś o koszykówce, później zacząłem zgłębiać publiczne dane dostępne dla NFL i szukałem w nich czegoś ciekawego. Mieszkałem w tamtym czasie w Londynie. Spotkałem się z Kamilem Nowakiem, który pracuje w Burnley jako skaut, ale interesuje się koszykówką i dzięki temu wiedział, że bawię się danymi. To on spytał mnie, czy nie byłbym w stanie pomóc im uporządkować zbierane w klubie dane — wyjaśnia. W ten sposób w jego życiorysie znalazła się praca w Premier League.
OTWARTE UMYSŁY
Osoby, które dotknęły świata angielskiej piłki, a potem pracują w Polsce, często zderzają się z szokiem, jeśli chodzi o mentalność i możliwości. W przypadku Kapuścińskiego jest jednak odwrotnie. W Rakowie nie musi, jak analitycy z “Moneyball”, przekonywać nikogo, że dane pozwalają widzieć więcej. W Burnley niekoniecznie tak było. - Na spotkaniach skautów każdy chciał mieć najważniejszy głos. Nie chodziło tylko o wypracowanie czegoś wspólnego, co przyniesie wartość klubowi, lecz o to, kto to wypracuje. Wielu było tam byłych piłkarzy albo skautów, którzy siedzieli już w branży kilkadziesiąt lat. Żeby być zawodowym sportowcem, trzeba wierzyć, że jest się bardzo dobrym. To samo potem przenoszą na inną dziedzinę. Pewnie w Liverpoolu, Manchesterze City czy Brentford jest inaczej, ale nie wszędzie w Anglii słucha się analityków danych. Jest tam dużo pieniędzy, ale nie każdy potrafi je dobrze inwestować. Inna sprawa, że gdybym trafił nie do Rakowa, tylko np. do Legii, też pewnie miałbym inne wrażenie. Tutaj właścicielowi udało się zbudować sztab, który myśli w sposób otwarty na nowości i w którym wszyscy widzą jeden cel. A to bardzo ułatwia pracę — nie ma wątpliwości.
ZWODNICZA HOLANDIA
Praca Kapuścińskiego to w dużej mierze “oglądanie” meczów przez Excela. - Dla każdego meczu jest wypisane około 3200 zdarzeń — od kontaktów z piłką, przez próby pressingu, po odbiory. W większości są to rzeczy, które dzieją się z piłką albo w jej okolicy. Gra bez piłki jest uwzględniona tylko w nieznacznym procencie — mówi analityk. Zanim dojdzie do momentu, w którym może rzeczywiście próbować wyciągać z morza danych jakieś wnioski, musi tak naprawdę zrozumieć, co dostawca danych ma na myśli, opisując konkretną sytuację. Wymaga to obejrzenia na wideo, co oznacza rubryka “piłka 50/50” albo jak platforma statystyczna definiuje pojedynek i w jaki sposób odróżnia dośrodkowanie od wysokiego podania.
Dopiero taka wiedza umożliwia mu merytoryczną rozmowę ze skautami czy sztabem. - Staram się współpracować z kimś, kto ogląda dużo więcej wideo niż ja, a potem konsultować z nim to, co wychodzi z moich analiz — podkreśla. - Jestem samoukiem. Ukończyłem tylko pierwszy poziom kursu skauta w angielskiej federacji. Potrzebuję więc też kogoś, kto spojrzy na moje wnioski bardziej piłkarskim okiem. Są ligi, jak na przykład drugi poziom w Holandii, w których zawodnicy świetnie wypadają w wielu parametrach statystycznych, ale gdy trafią do lepszych klubów, bardzo rzadko się sprawdzają. Chodzi o dodanie kontekstu do danych – tłumaczy. Analityk nie uważa więc, że wnioski, do których dojdzie, powinny być traktowane jako prawdy objawione. - Nie muszę mieć wpływu na decyzje i nie zależy mi na tym, czy dany zawodnik ostatecznie przyjdzie do klubu, czy jednak nie. Chodzi mi jedynie o to, by to, co wygeneruję, było w jakikolwiek sposób brane pod uwagę. A Robert bierze dane na poważnie — mówi.
ANALIZOWANIE PRZESTRZENI
3200 zdarzeń z jednego meczu może robić wrażenie, ale w rzeczywistości to oddanie ledwie drobnego ułamka tego, co zawodnik robi na boisku. Dla trenerów kluczowa jest przede wszystkim gra bez piłki. W światowym futbolu są już systemy pozwalające analizować poruszanie się zawodników. Polskie kluby na razie w tej kwestii jednak zupełnie raczkują. - Do tego trzeba mieć przede wszystkim bardzo duże zasoby ludzkie. To niezwykle trudne dane do opracowania. Jeden mecz jest opisany w kilkuset tysiącach zdarzeń. Dlatego uważam, że zanim zaczniemy się zajmować danymi trackingowymi (rejestrującymi pozycję zawodników klatka po klatce - przyp. red.), musimy zrobić porządek z tymi, które mamy. To prawda, że dla sztabu bardzo istotna jest boiskowa przestrzeń, bo to ona lepiej obrazuje założenia taktyczne. Zwłaszcza gra obronna jest trudna do analizy statystycznej. Na razie skupiamy się jednak na pomocy w przygotowaniu dwóch najbliższych okienek transferowych. Dopiero z czasem będzie można się zastanawiać nad rozwijaniem analizy danych o kolejne aspekty – zaznacza.
POMOC W SKAUTINGU
W Warcie zadania Kapuścińskiego ograniczone były stricte do kwestii skautingowych. Z tysięcy danych filtrował zawodników, którzy mogliby dla klubu być interesujący, następnie dział skautingu dodatkowo zawężał poszukiwania, skupiając się na kilku najciekawszych piłkarzach, których nazwiska wracały do analityka, by przyjrzał się im jeszcze wnikliwiej niż podczas pierwszego odsiewu. W Rakowie jego obowiązki mają być bardziej całościowe i dotyczyć całej analizy danych zbieranych przez klub. - Nie mam oczywiście wiedzy, żeby pójść do trenera i powiedzieć mu, jak drużyna powinna grać i co dokładnie zmienić, ale mam możliwość wskazania mu, co nie do końca działa i gdzie widać problemy — mówi.
PRZEMYŚLANY MODEL
Jego praca jest o tyle łatwiejsza, że Raków ma wypracowany bardzo powtarzalny i przemyślany model gry, a trener Marek Papszun ma dokładnie sprecyzowane wymagania wobec zawodników występujących na różnych pozycjach. Wiadomo na przykład, że napastnicy grający w Częstochowie zawsze są dobierani według podobnego klucza. Każdy z nich dobrze czuje się w walce fizycznej, jest pracowity i aktywnie podchodzi do pressingu. - W takiej sytuacji będziemy patrzeć na to, jak zawodnicy pracują w poszczególnych strefach boiska. Dzięki temu, że mecze są dokładnie opisane, jesteśmy w stanie określić, co się stało z piłką pięć sekund po tym, jak Vladislavs Gutkovskis podjął próbę pressingu, a co się stało dziesięć sekund później. Jeśli mamy napastnika, który biega do pressingu po kilkanaście razy w meczu w okolicach pola karnego przeciwnika i nie następuje po tym żadne odzyskanie piłki w ciągu dziesięciu sekund po pressingu, wiemy, że coś jest nie tak. Być może to ktoś, kto ciągle podbiega do bramkarza, ale robi to w całkowitym oderwaniu od zachowania drużyny. Parametry fizyczne sprawdzamy nie poprzez spojrzenie na wzrost i wagę piłkarza, lecz przez to, jak przyjmuje piłkę pod presją. W danych widać też, ile razy zawodnik przyjął piłkę, mając na plecach obrońcę i odegrał ją tak, że partner był w stanie kontynuować akcję — tłumaczy.
FILTROWANIE DANYCH
Filtrując dane, analityk jest oczywiście w stanie sprecyzować, które parametry dla jego klubu są bardziej istotne, które nie mają znaczenia, a które są wręcz oceniane negatywnie. Podobnie jest w stanie przypisać poszczególnym zagraniom inne znaczenie, zależnie od tego, w których miejscach boiska do nich dochodzi. - Nie szukamy przecież graczy, którzy mają wysoką skuteczność dryblingów, ale w każdym meczu bardzo często dryblują w kierunku własnej bramki. Niekoniecznie chcemy wahadłowych, którzy dryblują pod własną bramką, ale chcemy takich, którzy robią to w okolicach pola karnego przeciwnika i często wprowadzają piłkę z drugiej tercji boiska do trzeciej — wyjaśnia sposoby działania. W ten sposób Raków może próbować poszukiwać niekoniecznie najlepszych zawodników, ale za to takich, którzy znacząco poprawią jakiś kulejący w drużynie parametr.
BRAKUJĄCA I LIGA
Kapuściński wierzy, że nawet jedna osoba zajmująca się w klubie danymi, jest w stanie wypracować pewną przewagę konkurencyjną, w końcu w wielu klubach Ekstraklasy danych statystycznych kompletnie się nie gromadzi, a platform statystycznych używa się głównie do oglądania nagrań fragmentów meczów. Bolączką analityków jest jedynie to, że na podstawie szczegółowych danych StatsBomb można na ten moment śledzić jedynie ekstraklasę oraz ligi zagraniczne, ale już nie I czy II ligę. - Mam nadzieję, że od najbliższego sezonu pojawią się też bardziej zaawansowane statystyki dla I ligi. Być może dzięki temu dowiemy się, że są tam talenty, których jeszcze nie znamy — podkreśla Kapuściński.
ROZŁOŻONE TALENTY
Nawet on nie uważa jednak, że futbol dojdzie kiedyś do punktu, w którym transferów będzie się dokonywać tylko na podstawie tabelek w Excelu. - Ma na to wpływ specyfika dyscypliny. Panowanie nad piłką stopami jest dużo trudniejsze niż rękami. To punkt wyjścia. Liczba sytuacji, po których można strzelić gola, też jest znacznie mniejsza niż w innych sportach. Żeby piłka była łatwiejsza do opisania danymi, musielibyśmy grać pięciu na pięciu na dużo mniejszych boiskach — mówi. To nie oznacza jednak, że analitycznym w wyścigu z baseballem, koszykówką czy futbolem amerykańskim piłka wciąż nie wyszła z drewnianych chatek. - Coraz więcej klubów zatrudnia ludzi, którzy pracowali z technologią, czy spędzili część życia na uniwersytecie, starając się rozwikłać specyfikę jakiejś dyscypliny sportu. Pewnie gdyby powstała Superliga, drenaż największych specjalistów byłby jeszcze dużo większy. Teraz talenty są w miarę dobrze rozłożone. W różnych ligach jest sporo klubów o różnym poziomie budżetów, które starają się w danych dostrzec wartość dodaną — mówi.
PASJONACI Z TWITTERA
W polskich warunkach takie kluby też się pojawiają. Osoby odpowiedzialne za analizę danych pracują w Rakowie czy w Lechu Poznań. Jagiellonia Białystok poszukiwała nowego trenera przy pomocy firmy Sports Solver. Wisła Kraków ogłosiła niedawno, że zaczyna korzystać z danych StatsBomb. Niektóre kluby dostrzegają już, że umiejętna praca z danymi potrafi być oszczędnością, a nie wydatkiem. A kandydatów do pracy wcale nie jest tak trudno znaleźć. - Na początek wystarczy przejrzeć Twittera i poświęcić trochę czasu na sprawdzenie, kogo interesuje analityka i wyłowienie pasjonatów, którzy wrzucają związane z nią treści — twierdzi Kapuściński. Nie tylko on jest przykładem, że dziś do świata zawodowej piłki można już wejść dosłownie z ulicy. Trzeba tylko obronić się wiedzą. Michał Świerczewski, odkąd prowadzi Raków, poszukuje na różne stanowiska ludzi właśnie z takim podejściem. Takich, którzy zastanawiają się, dlaczego coś robią, a nie, którzy robią coś, bo zawsze tak robili. Niespełna dwadzieścia lat po premierze pierwszego amerykańskiego wydania, “Moneyball” zaczyna wreszcie trafiać pod polskie strzechy.