Jak Opta zmienia futbolowy świat danych i statystyk. Opowiada Duncan Alexander (WYWIAD)

Zobacz również:Najbardziej romantyczny beniaminek od czasów Newcastle Keegana. Czy Leeds zderzy się ze ścianą?
1500 x 1000.png
Graf. Kacper Dudziak

Duncan Alexander to szef działu danych w firmie Opta. W rozmowie z newonce.sport opowiada o swojej pracy, globalnym rozwoju marki, tym, jaki wkład w niego mają Polacy, o skomplikowanych mechanizmach zbierania statystyk, ich wpływie na odbiór piłki oraz przyszłości analityki w futbolu. Zahaczamy również o historię Premier League i jej obecny sezon.

MICHAŁ GUTKA: Nazwa twojego stanowiska w Opta brzmi bardzo pojemnie. Na czym polega twoja praca?

DUNCAN ALEXANDER: Tytuł „chief data editor” jest już trochę nieaktualny, obecnie bardziej skupiam się na marketingu. Zależy nam na poszerzeniu marki, ale generalnie moje codzienne zadania są te same. Główne założenie to zbieranie mnóstwa danych, tylko że teraz jeszcze muszę myśleć o tym, jak zaprezentować je potencjalnym klientom i naszym współpracownikom, by chętniej z nich korzystali. Zawsze mieliśmy zespoły, które przeglądają liczby i tworzą na ich podstawie historie czy dogłębne analizy. Dawniej otrzymywali je tylko broadcasterzy, ale później przenieśliśmy jeszcze nasze działania na media społecznościowe. To, co najbardziej pomaga w budowaniu marki, to mówienie bezpośrednio do kibiców.

W jaki sposób zaczynałeś w Opta?

Opta sama w sobie istnieje od 1998 roku, ja dołączyłem do niej jakieś 15 lat temu. Początek był bardzo zwyczajny – odpisałem po prostu na ogłoszenie i dostałem się na bazie własnej wiedzy. W sumie to znów czytałem jeden z tych sportowych magazynów, o których mama mówiła mi, żebym dał sobie z nimi spokój. Powtarzała, że zainteresowania piłką nie wyżyję. Pamiętam, że napisałem wtedy, chwaląc się, że potrafię wymienić co najmniej czterech piłkarzy każdego z 92 klubów Football League. Spodobało im się to. Aby dostać pracę w Opta musiałem... rozwiązać quiz i otrzymać jak najwyższy wynik. Zdziwiłem się, jednak to naprawdę dobry sposób, by sprawdzić, ile wiesz. Musiałem też napisać o jakimś zawodniku z użyciem danych statystycznych. W taki sposób mnie przyjęli, a później szybko zaczęło się to rozwijać. Najmocniej od 2009 roku, kiedy powstało OptaJoe, skupione wokół Premier League.

To wydaje się teoretycznie proste, ale jak dokładnie Opta zlicza te statystyki?

To naprawdę rozbudowana i droga operacja. Mamy duże zespoły zbierające dane w całej Europie, w Indiach oraz Ameryce Południowej. Sama metoda ich gromadzenia to mieszanka technologii komputerowej i ludzkiego wkładu. Trafność statystyk wciąż nie jest na tyle duża, by opierać się tylko na maszynowym kolekcjonowaniu liczb, choć ten moment w końcu nastąpi. To jest całkiem dobre nagranie, które tłumaczy, w jaki sposób zbiera się te statystyki:

Nasi potencjalni współpracownicy przez 3-6 miesięcy uczą się, jak wszystko robić – i nie każdy przechodzi przez ten proces pomyślnie! – i później najczęściej są oddelegowani do konkretnych lig lub klubów. To wymagający okres, z każdego meczu zbierają wtedy 1200-1500 suchych danych.

Brzmi jak spory wysiłek.

No cóż, to na pewno nie jest łatwe, sam początkowo nie musiałem tego robić, ale dziś jest inaczej. Pracownicy Opta muszą być w stanie oglądać mecz w taki sposób, by błyskawicznie rozpoznać piłkarza – co wydaje się łatwe w Premier League, LaLiga, Lidze Mistrzów, ale w niższych ligach albo w ligach z mniej znanych krajów robi się trudno. Ponadto muszą śledzić wszystko, co dzieje się na boisku i jednocześnie od razu w czasie rzeczywistym wprowadzać te dane do systemu. Detale, typu rodzaje strzałów, mogą być dodane minutę później, ale reszta idzie na bieżąco. Ponadto jest jeszcze jedna osoba przy każdym spotkaniu, która przeprowadza tzw. kontrolę jakości, również w czasie rzeczywistym, ponieważ te liczby od razu trafiają do klubów i firm bukmacherskich oraz oczywiście do mediów. To dlatego wszystko musi być najbardziej dokładne, jak tylko to możliwe.

Czytałem w jednej rozmów, że firma StatsPerform, do której należy Opta, współpracuje z mediami w ponad 20 krajach i otrzymaliście w 2019 roku przeszło 50 tysięcy zgłoszeń. Ile osób dziś jest zaangażowanych w projekt Opta?

Obecnie to między 4000 a 5000 osób, które zajmują się wszystkim w danych regionach, za jakie są odpowiedzialne. Bazowa grupa w Wielkiej Brytanii, która tworzy zestawienia statystyczne dla mediów, to około 20 osób. Co ciekawe Polska jest dla nas bardzo ważnym krajem pod względem rozwoju technicznego. Wiele naszych aplikacji powstaje właśnie tam, mamy oddział w Katowicach. Ich działania obejmują tworzenie narzędzi, które pomagają nam zbierać dane, oraz widgetów i zbiorów, jakie później trafiają do mediów i klubów. Ułatwiają nam wprowadzanie danych.

Wielki wpływ na rozwój Opta miał Twitter. Krótkie informacje, podane w żartobliwy sposób albo zestawiający ze sobą dwa absurdy – to musiało się udać. Dziś sam masz sporo obserwujących (77 tysięcy), OptaJoe ponad 1.2 miliona, a jako Opta prowadzicie konta twitterowe w wielu językach.

Tych profili jest dziś w sumie około 20, a jeszcze dochodzi statsBYSTATS w Stanach Zjednoczonych. Twitter bardzo nam pasował. Tworzyliśmy mnóstwo analiz, zbieraliśmy fakty i ciekawostki, więc te, których nie wykorzystywali nasi klienci, łatwo można można było użyć na Twitterze. Zdaliśmy sobie sprawę, że to też dobre okno wystawowe, by pokazać różne nasze pomysły. Wrzucaliśmy coś, a potem odzywał się ktoś z wiadomością typu: „Czy moglibyście rozbudować tę statystykę o jakieś TOP10 tej kategorii” i tym podobne. Inne platformy społecznościowe nie funkcjonowały pod tym względem aż tak skutecznie, choć teraz poszerzamy naszą działalność o wideo. Mocno koncentrujemy się chociażby na Twitchu.

Niektóre wrzutki są naprawdę zabawne, jak np. piłkarze z cząstką „wood” w nazwisku z największą liczbą goli albo ci z największą liczbą samogłosek w nazwisku. To rzeczy, które zapamiętujesz i czekasz na dobry moment czy wrzucasz je pod wpływem chwili?

To bardziej domena mojego prywatnego konta. Tam się bawię i wymyślam jakieś randomowe rzeczy, jak zapewne wielu użytkowników. Różnica jest taka, że ja posiadam narzędzia, dzięki którym mogę sobie odszukać i posegregować takie coś w szybkim czasie, a teraz również publikę, która to zobaczy. Poza tym uważam, że ludzie traktują niektóre liczby i statystyki zbyt poważnie, więc dobrze to urozmaicić czymś luźniejszym. Gdy napiszesz, że Roy Hodgson jest o 127 dni starszy niż Estadio Santiago Bernabeu to bardziej to działa na wyobraźnię niż to, że jest najstarszym menedżerem w historii Premier League.

Masz jakąś swoją ulubioną ciekawostkę tego typu?

Było tego tak wiele... Ale lubię wszystko, co dotyczy jakiegoś osadzenia w czasie w odniesieniu do piłki i jakiegoś wydarzenia, które ludzie pamiętają albo były jakimś przełomem. W czasie dokończenia Ligi Mistrzów porównałem np. RB Leipzig do Minecrafta.

Dziś dostępność danych jest duża. W jaki sposób zmieniło to oglądanie piłki z perspektywy widza?

Kibic może dziś oglądać mecz w taki sposób, jaki tylko zapragnie. Możesz otoczyć się liczbami, albo mieć ich pod ręką absolutne minimum, skupić się na konkretnym piłkarzu, klubie albo lidze i być swoim własnym ekspertem. Dziś jedne z najlepszych analiz znajdziesz u fanów, którzy regularnie oglądają mecze i dzielą się swoją wiedzą, a nie w programach telewizyjnych. To zasługa powszechnej dostępnosci liczb.

Sam też jesteś wielki fanem Wycombe Wanderers, którzy niedawno weszli do Championship.

Zawdzięczam kibicowanie im mojemu dziadkowi. Chodziłem z nim na mecze jako dzieciak i wtedy Wycombe przebijało się z lig regionalnych do Football League – to był dobry moment, by zostać fanem. Teraz to w ogóle niewyobrażalne, że są w Championship. To nie był zbyt dobry rok dla nikogo, ale wygranie barażów w lipcu dla mnie osobiście stanowiło szczęśliwy moment. To było coś!

Wolisz jako kibic urok piłki z niższych lig od Premier League?

Niekoniecznie, ale dobrze dziś wspierać kogoś innego niż jakąś konkretną drużynę w Premier League. Nie żebym mimo tego nie słuchał ciągle, że jestem wobec kogoś uprzedzony...

Niedawno przysłuchiwałem się jednej audycji, gdzie była mowa o użyciu statystyk w zły sposób. Krytykowano na przykład takie jak „drużyna X nie pokonała drużyny Y na wyjeździe w top-flight od 35 lat”. Jednocześnie Opta wieloma takimi operuje.

Tak, też to słyszałem. Nie jestem osobiście fanem takich danych, dopóki nie ujmiemy ich w jakiś bardziej absurdalny sposób – nie wiem, na przykład, że coś nie wydarzało się od czasu wynalezienia plastku. Ale są platformy i ludzie, którzy potrzebują tego rodzaju contentu, mam na myśli głównie bukmacherów, dlatego właściwie takie statystyki w sumie powstają. Ale tak naprawdę to w zasadzie niewiele znaczące ciekawostki.

Ciekawe, że mówisz akurat o bukmacherach. „The Athletic” podawał, że piłkarze zamierzają walczyć w sądzie z nimi oraz firmami statystycznymi, ponieważ te bez ich zgody wykorzystują liczby, a potem zbijają na tym kapitał. To dla Opta zagrożenie?

Obawiam się niestety, że nie mogę udzielić żadnego komentarza na ten temat.

Opta zbiera dane od sezonu 2003/04. Czy są plany, by poszerzyć bazę o wcześniejsze lata?

Niektóre bardziej szczegółowe sięgają do 1998 roku, no i mamy te podstawowe – gole, asysty, wyniki, kartki – od sezonu 1992/93. To jednak dopiero rok 2003 był momentem, do którego mogliśmy się cofnąć szczegółowo mecz po meczu. Później od sezonu 2006/07 te współrzędne stały się jeszcze bardziej rozbudowane i możesz sprawdzić dokładnie kwestię X czy Y. Ale dopracowanie detali z wcześniejszych lat jest o tyle trudne, że nie ma po prostu nagrań z tych spotkań. Poza tym nie wiem, w jaki sposób statystyki celności podań czy czegoś takiego z początku lat 90. byłyby dziś użyteczne. Ale zbieramy archiwalne dane. Kiedyś przeanalizowaliśmy wszystkie mundiale od 1966 roku do dziś, co okazuje się bardzo przydatne. Na przykład ostatnio po informacji o śmierci Diego Maradony mogliśmy posiłkować się danymi, które zebraliśmy i pokazać za pomocą statystyk, jak radził sobie w 1986 roku.

Napisałeś też dwie książki. W 2016 roku wyszła „OptaJoe’s Football Yearbook”, a rok później „Outside the Box: A Statistical Journey through the History of Football”. Co skłoniło cię do ich napisania i co w nich znajdziemy?

Wydawca sam zgłosił się do mnie, bym wykorzystał swoją wiedzą i dostępne narzędzia. Pomysł mi się spodobał. Pierwsza to bardziej rocznik, podsumowanie sezonu 2015/16 z pamiętnym mistrzostwem Leicester City. Druga to analiza pierwszych 25 lat istnienia Premier League. Obie się różnią, ale też w jednej i drugiej jest sporo informacji o historii piłki nożnej, Pucharu Europy, mistrzostw świata i Europy itd. Mam nadzieję, że na 30-lecie wyjdzie zaktualizowana wersja „Outside the Box” i przy okazji jestem w trakcie prac nad trzecią książką.

Skoro o historii Premier League mowa, to który sezon był według ciebie najciekawszy, a w którym wiało nudą?

Najlepszy był albo 2011/12, albo 2013/14, bo walka o mistrzostwo była wtedy bardzo zacięta. Takiej końcówki, jak z golem Sergio Aguero w 2012 roku możemy już nigdy nie przeżyć, a dwa lata później działo się dużo na finiszu. Najnudniejszy? Być może 2017/18. To dobry wybór, bo nikt nie gonił Manchesteru City i choć doceniam jego wielkość, to z perspektywy całej ligi nie działo się wiele. Podobnie było w sezonach 1999/2000 i 2000/01, gdy wygrywał Manchester United. Poszło im zbyt łatwo, nie mieli prawdziwej konkurencji.

Czy są jakieś statystyczne ciekawostki, które coś już nam mówią o tym sezonie i można na ich podstawie wyciągnąć wnioski?

Jeśli będzie wyglądał tak, jak do tej pory, to będzie trochę jak w połowie lat 90., gdy różnica między czołówką a dołem tabeli była relatywnie nieduża, najmniejsza w historii ligi. Ale to, czy to nowy trend, czy jedynie wypadek przy pracy w związku z pandemią, dopiero się okaże. Widać również znaczny wzrost liczby rzutów karnych. Jesteśmy też na kursie po rekordowy odsetek zwycięstw gości. W statystykach da się też zaobserwować, że praktycznie w całej lidze poprawiła się skuteczność, choć trochę ona spadła w ostatnich kilku kolejkach.

Rozwój statystyk i analiz piłkarskich postępuje bardzo szybko, rosną na przykład takie platformy jak Smarter Scout. Jaką przyszłość widzisz w tej gałęzi?

Sztuczna inteligencja znacznie przyspieszy wszystkie procesy i poprawi modele analityczne – to już wchodzi, a w niektórych aspektach jest w jakimś stopniu obecne dzisiaj na szerszą skalę. Wciąż jednak potrzebni będą ludzie, którzy różne dane zinterpretują i zwizualizują tak, by te opracowania były zrozumiałe. Roboty nas jeszcze całkowicie nie wyprą.

Jakie w takim razie macie plany na przyszłość? Może rozważacie profil OptaJanusz o polskiej lidze?

Nie mogę jeszcze mówić o detalach, ale chcemy się dalej rozwijać. Mamy dużo ciekawych rzeczy przygotowanych na 2021 roku. Najważniejsze są jednak podstawy – cały czas chcemy za pomocą liczb lepiej opowiadać historie i tworzyć bardziej wnikliwe analizy. A co do OptaJanusza – jestem otwarty na wszelkie propozycje! Nie mówię nie.

Cześć! Daj znaka, co sądzisz o tym artykule!

Staramy się tworzyć coraz lepsze treści. Twoja opinia będzie dla nas bardzo pomocna.

Podziel się lub zapisz
Futbol angielski i amerykański wyznaczają mu rytm przez cały rok. Na co dzień komentator spotkań Premier League w Viaplay. Pasję do jajowatej piłki spełnia w podcaście NFL Po Godzinach.