You are currently viewing Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?
fot. Julia Piątkowska / eloski.eu

Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?

W ostatnich dniach tabela ta staje się coraz popularniejsza wśród fanów skoków. Ranking Elo, służący do obliczania poziomu zawodników, jest na ustach wielu ekspertów i statystyków, ale na pierwszy rzut oka może nie być do końca zrozumiałym procesem. Dla SkokiPolska.pl objaśniają go główny twórca rankingu – Adam Kobyłka, oraz Andrzej Żurawski (znany jako @ski_excel).

 

Wiktor Marczuk: Jak narodziła się cała idea stworzenia skokowego rankingu Elo?

Andrzej Żurawski (ski_excel): To wszystko powstało poprzez śledzenie różnych dyskusji na portalu X (dawniej Twitter) i porównań w innych sportach. W dużej mierze opierało się to na działalności użytkownika @DbAbsur. Bardzo często wykorzystywał ranking Elo do różnych analiz dotyczących prawdopodobieństwa różnych rezultatów. Na tej podstawie był w stanie przewidzieć, czy reprezentacja Polski w piłce nożnej awansuje na ME lub MŚ. Ten ranking jest w środowisku statystyków sportowych rzeczą dobrze znaną, wywodzi się z szachów. Tam jest powszechnie wykorzystywany do wszystkich rankingów turniejowych, a potem zaczęto się nim posługiwać w innych sportach. Piłka nożna to najbardziej klasyczny przykład. W środku różnych dyskusji wpadł pomysł, by taki system zrobić w skokach, znaleźć poparcie liczbowe na to, czy dany rezultat był niespodzianką, czy też nie. Nie było to jednak takie proste, bo cały ranking to wykorzystywanie bezpośrednich porównań między zawodnikami. Dobrze działa on w sportach, gdzie są dwie drużyny i jeden rezultat, a skoki tak nie funkcjonują. Doszliśmy do wniosku, że można potraktować zawody z pięćdziesięcioma skoczkami jako pojedynek każdego z każdym. Skoro ktoś był pierwszy, a ktoś czterdziesty ósmy, to można stwierdzić, że ten pierwszy wygrał bezpośrednie starcie tych dwóch zawodników. To nie jest tak dobry miernik, jak oryginalne Elo, natomiast daje pewne wyobrażenie.

Adam Kobyłka, główny twórca rankingu Elo: To była zupełnie spontaniczna decyzja. Wynikła z sytuacji, w której @DbAbsur rzucił hasło, że bardzo chętnie zobaczyłby skokowy ranking Elo, ale pewnie jest to mało prawdopodobne do zrealizowania. Miał na myśli zrobienie tego w Excelu, a to rzeczywiście mógł być problem. Jestem z wykształcenia programistą, więc stwierdziłem, że nie powinno to sprawić zbyt wielu problemów. Zebrałem się do roboty i w kilka godzin powstał prototyp takiego rankingu, a dokładniej napisanie kodu.

 

To było zaskakujące, że taki skomplikowany sport, jak skoki został przedstawiony w takiej formie dzięki zaledwie kilku godzinom pracy?

Adam: Nie, bo w zasadzie ten algorytm jest prosty. Inną kwestią było podejście do tego, jak to wszystko rozgryźć. Jeden konkurs skoków to w tym rankingu pojedynek każdego z każdym, a to jest jakaś nowość. Rozpisanie kodu zajęło kilka godzin, ale dopasowanie parametrów to już kolejne kilka dni pracy. Budowanie bazy wyników zajęło i nadal zajmuje sporo więcej czasu. 

 

Skoki są bardzo nieprzewidywalne, co roku sytuacja może zarysować się w nich całkowicie inaczej. Elo według Was dobrze adaptuje się do nagłych wahań formy zawodników?

Adam: Myślę, że robi to całkiem nieźle, ale ma pewne opóźnienia. Potrzeba kilku konkursów, by aktualna dyspozycja skoczka „wyrównała się” z rzeczywistością. Ktoś złapie formę i dopiero po kilku zawodach odzwierciedli się to w rankingu. Czasami są też jednorazowe wyskoki, a wtedy nie zaobserwujemy klarownej zmiany w postaci dużego awansu czy spadku. Nieprzewidywalność skoków też jest pewnym problemem, bo wartość predykcyjna jest tak naprawdę znikoma. Nasz ranking myli się bodajże w około 30% przypadków. Skoki są bardzo losowym sportem i wyszło nam to ze statystyk. Ciężko jest tu przewidywać cokolwiek, można nawet podważyć zasadność rankingu przy tak dużej losowości. Skoro rzut monetą ma 50% prawdopodobieństwa, to u nas wprawdzie jest lepiej, ale niewiele.

      

Stephan Embacher fotJuliaPiatkowska 300x219 - Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?
Stephan Embacher (fot. Julia Piątkowska)

Mieliście momenty zwątpienia, że w skokach coś takiego nie będzie mieć jednak racji bytu?

Andrzej: Myślę, że to trzyma się nas do dziś. Po części wynika to z tego, że ranking nie działa w stu procentach dobrze. Trzeba zawsze wpisać „współczynnik K” – przyjąć pewną wartość, do której te potęgi podniosą się przy obliczaniu. Było dużo eksperymentowania, jaką wartość przyjąć do naszych modeli. Szukaliśmy takiej, która najlepiej odzwierciedli prawdziwe wyniki, ale zawsze jest możliwość lepszej kalibracji. Jest jednak przykład wskazujący, że ten model działa nawet lepiej, niż się spodziewaliśmy. Adam o tym, że Stephan Embacher będzie wschodzącą gwiazdą, pisał jeszcze w listopadzie. Ranking Elo pokazywał piękny wzrost postępu tego zawodnika. O nim do tej pory słyszeli głównie ci fani, którzy mocno orientowali się w wynikach zawodów lokalnych.

 

Poza Embacherem można wskazać inne takie sukcesy rankingu Elo?

Andrzej: Bawiliśmy się na przykład w przewidywanie par KO z minionego Turnieju Czterech Skoczni. Zabawne było to, że ranking Elo sugerował czyjąś słabszą formę, pojawiały się komentarze o niedoszacowaniu, a potem faktycznie ta para była dla nas zwycięska. Nie można jednak dokonywać ocen na podstawie pojedynczych sytuacji, bo to zawsze mogło być przypadkowe rozstrzygnięcie.

Adam: Nasz system przewidział wyniki par KO w tegorocznym TCS ze skutecznością wynoszącą 86%. Liczyliśmy to z Pawłem Borkowskim, który bardzo nam pomaga przy rankingu. Myślę, że to jest świetny wynik. Nie wiem, ile w tym losowości, a ile rzeczywistej wartości, ale jestem bardzo zadowolony z rezultatu. Co ciekawe, w Innsbrucku Embacher wygrał parę z Władimirem Zografskim, a w Bischofshofen Benjamin Østvold z Andrew Urlaubem. Ranking Elo wskazywał ich jako faworytów. Obaj nie mieli wtedy jeszcze punktów PŚ, a ich przegrani przeciwnicy już tak.  

 

Aktualnie na stronie są trzy wersje rankingu: pierwsza to zima 2023/2024 (bierze pod uwagę tylko PŚ, zmagania mistrzowskie i LGP), druga to wszystkie zawody rangi FIS z wagą 1, a trzecia to PK z wagą 0,75, FIS Cup 0,5, niższa ranga 0,25. Która najlepiej przekłada się na rzeczywistość?

Andrzej: Najlepsza jest ta pierwsza. Ona pojawia się tuż po włączeniu strony głównej właśnie z racji na wiarygodność. Te wszystkie wagi zostały wprowadzone po to, by uniknąć dziwnych przypadków. Jeżeli świetny zawodnik pojedzie na Puchar Kontynentalny i go wygra, to wtedy zyskuje bardzo dużo wygranych pojedynków na raz. Zależało nam na tym, żeby uwzględnić prestiż danych zawodów. W Elo piłkarskim też tak jest – niby wszystkie mecze są takie same, ale za wygrany mecz MŚ dostaniesz więcej punktów, niż za mecz towarzyski. Wracając do „współczynnika K” – gdy otrzymaliśmy pierwszy model i „wypluł” nam dane, to wyglądało to całkiem fajnie. Naszym dużym problemem był Halvor Egner Granerud. On jest takim skoczkiem, który po 10 zwycięstwach z rzędu może nagle skończyć bez punktów. On w rankingu przy takim ekscesie początkowo leciał w dół o 20 pozycji, co jest bez sensu. Trzeba było zredukować skutki takich „odpałów”. W rankingu wprawdzie powinien zaliczyć spadek, ale nie tak drastyczny. To wszystko bardziej wymagało sztuki i zabawy, niż konkretnego liczenia.

 

MarkusEisenbichler Klingenthal2021 fotJuliaPiatkowska 300x199 - Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?
Markus Eisenbichler (fot. Julia Piątkowska)

Chciałbym, żeby kilka takich zawiłości z rankingu zostało wytłumaczone. Gdy rozmawiamy, na stronie głównej Markus Eisenbichler pomimo słabiutkiego wejścia w zimę i niemrawego lata nadal jest na 17. miejscu.

Andrzej: To jest poniekąd słabość tego rankingu. Wezmę pod lupę inny przykład, nawet prostszy niż Eisenbichler. W rankingu Elo kobiet liderką jest Eva Pinkelnig. Samo w sobie może to nie jest dziwne, patrząc na jej wyniki z ostatnich dni, ale ona prowadzi od ponad pół roku. W Pucharze Świata nie jest tak wysoko, bo odpuściła początek sezonu. Z Eisenbichlerem sytuacja jest dokładnie ta sama – on był bardzo wysoko w rankingu przed tym letnio-zimowym spadkiem formy, ale skakał na tyle rzadko, że nie zdołał sobie dołożyć ujemnych punktów. Jeszcze kilka jego porażek i spadnie na pozycję, która bardziej będzie odpowiadać jego aktualnej formie.

 

Za to ranking wyjątkowo pokarał Władimira Zografskiego. Spadł do szóstej dziesiątki i jest niżej od takich zawodników, jak Eetu Nousiainen czy Maximilian Steiner.

Andrzej: To jest bardzo ciekawe. Jeśli ktoś chce zachować swoją pozycję w rankingu Elo, to najlepiej jest nie startować. Zografski w ostatnim czasie miał jednak kilka gorszych konkursów i ponosił bezpośrednie porażki z zawodnikami, którzy w teorii powinni być od niego słabsi. Ranking Elo traktuje konkurs jako zestaw pojedynków. Po swoich sukcesach z LGP Zografski wchodził w zimę z bardzo wysokiej pozycji. Za to, że nie mógł awansować do drugiej serii, ponosił konsekwencje, przegrywał z bardzo słabymi skoczkami i miał sporo odejmowanych punktów.

Adam: Zografski w naszym rankingu jest w szóstej dziesiątce, a w Pucharze Świata na 30. miejscu. Klasyfikacja PŚ nie odda dobrze tego spadku formy, nawet jakby miał do końca sezonu nie zapunktować. Bliżej rzeczywistości jest obecnie miejsce w Elo. Co do tego braku startów, to świetnie to widać na przykładzie Eisenbichlera w wersji rankingu biorącej pod uwagę tylko PŚ, LGP i zawody mistrzowskie. On wciąż jest tam wysoko, a przy rankingu ważonym biorącym pod uwagę PK stacza się coraz niżej.

  

Ryoyu Kobayashi fotJuliaPiatkowska 001 1 300x200 - Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?
Ryoyu Kobayashi (fot. Julia Piątkowska)

Jest też zakładka ze szczytowym momentem zawodnika pod względem punktów rankingowych. Dlaczego Ryoyu Kobayashi był mocniejszy w lutym 2022, a nie podczas swojej dominacji w sezonie 2018/2019?

Andrzej: To wynika z dwóch powodów. Wrócę ponownie do kobiet: Nika Prevc wygrywa ostatnio seryjnie, a w rankingu Elo jeszcze jest trzecia. Ma na tyle krótką karierę, że nie mogła sobie stworzyć wystarczająco mocnej „bazy”. Kobayashi w 2019 roku dopiero budował swoją pozycję, bo to był jego pierwszy sezon w ścisłej światowej czołówce. Wchodził z relatywnie niskiego wyniku, a gdy przyszedł 2022 rok, miał już o wiele lepszą podbudowę. Maksymalny ranking historyczny trzeba jednak brać trochę z przymrużeniem oka, nie patrzeć po nim na to, kto był najlepszy w historii. Gdy na skoczniach rządził Matti Nykänen, to rankingi były jeszcze niskie. Nie chcę skłamać, ale wydaje mi się, że po pierwszym konkursie PŚ w historii wartością wyjściową było 1600 punktów, a ten, kto wygrał, miał ich 1650. Kobayashi w 2022 roku miał świetny sezon, a przy tym pokonywał zawodników z bardzo wysokim rankingiem, jak Halvor Egner Granerud czy Stefan Kraft. Tak samo Gregor Schlierenzauer z Simonem Ammannem w 2010 roku – w rankingu maksymalnym mają czołowe pozycje, bo budowali je przez pokonywanie siebie nawzajem.

Adam: Rankingu można użyć do porównywania siły szerokiej stawki w danych sezonach. Można zaobserwować, czy była duża rywalizacja między zawodnikami. Jeżeli ktoś dominuje, to nie wygrywa z wystarczająco mocnymi zawodnikami, by zdobywać dużo punktów, więc różnica może nie być do końca widoczna. Gdy jest silna szeroka stawka, to zawodnicy są w stanie zdobyć dużo punktów i zbudować większą przewagę nad sobą. Ciekawy jest przypadek Adama Małysza z sezonu 2000/2001. Można się zastanawiać, na ile jego wyniki były prawdziwą dominacją, a na ile wynikały ze słabości przeciwników. 

 

Gdyby Stefan Kraft wygrał najbliższy konkurs PŚ, to ile on mniej więcej dostanie punktów do rankingu?

Adam: Tak naprawdę nie przybędzie mu już zbyt wiele punktów. Od przeciwników także nie do końca to zależy, bo Kraft pokonuje już wszystkich najlepszych na świecie. Z każdym kolejnym zwycięstwem otrzymuje coraz mniej punktów. Im silniejszy jest lider, tym potencjalnie mniej punktów jest w stanie zdobyć, bo rywalizuje z coraz słabszymi w rankingu zawodnikami. Prowadzący jest za to w trudnej sytuacji, gdy ma zniżkę formy. Im wyższa jest różnica między nim a rywalami, tym więcej będzie tracił w wypadku przegranej.

 

DawidKubacki PSRuka2023 lot fotJuliaPiatkowska 300x200 - Obliczenia, które podbijają środowisko skoków narciarskich. Na czym polega ranking Elo?
Dawid Kubacki (fot. Julia Piątkowska)

A co by było, gdyby – czysto hipotetycznie! – 28. w rankingu podczas naszej rozmowy Dawid Kubacki w PolSKIm Turnieju odnotował dwa zwycięstwa i jedno miejsce na podium przy wciąż świetnych wynikach Krafta czy Kobayashiego?

Adam: Potrzebowałby trochę czasu do zbudowania swojej pozycji. Tak jak mówiłem, jest trochę opóźnienia z odzwierciedleniem aktualnej formy, ale myślę, że przy takim scenariuszu byłby w stanie zdobyć 150-200 punktów. Taki wynik mógłby go wywindować w okolice 15. pozycji. Czołówka sporo by straciła przez porażki z Kubackim.

 

Czy jest konkretna przestrzeń, w której można dopracować ranking?

Adam: Można popracować nad innymi rozkładami prawdopodobieństwa. W tym momencie używamy krzywej logistycznej. Ona zakłada, że jeśli zawodnik ma 400 punktów przewagi, to prawdopodobieństwo jego wygranej z przeciwnikiem wynosi 90%. Jest przestrzeń, by podziałać, dobrać inny rozkład statystyczny. W szachach próbowano wprowadzić coś innego, ale koniec końców ta krzywa logistyczna okazała się najbardziej odpowiednia. Chciałbym też koniecznie wspomnieć o pracy, jaką w budowanie rankingu włożył Paweł Borkowski. Dodaje na bieżąco wyniki zawodów krajowych, a na tworzenie bazy poświęca nawet więcej czasu ode mnie. Część bazy kobiecej pomógł mi za to zbudować Kacper Gładzik.       

 

Myślicie, że trenerzy kadr będą w przyszłości sugerować się rankingiem Elo?

Andrzej: Wątpię. Ranking Elo z perspektywy trenera ma bardzo dużą zaletę i jest ona widoczna szczególnie w krajach, gdzie mamy sporą liczbę skoczków, czyli Austria lub Norwegia. System pozwala trenerowi kadry A dostrzec, że jest zawodnik w kadrze B, na którego do tej pory mógł nie zwrócić wystarczającej uwagi. To jest na tyle niszowy sport, że zasadniczo Thomas Thurnbichler jest w stanie samodzielnie ocenić formę polskich skoczków. Andreas Widhölzl byłby za to w stanie dzięki rankingowi zauważyć, że wśród tych dwustu skoczków mógł przegapić kogoś, kto fajnie się prezentuje w FIS Cup i ma wystrzał formy. Pół żartem, pół serio, ale gdyby spojrzał na ranking Elo w listopadzie, to do powołania Stephana Embachera mogłoby dojść znacznie wcześniej.

 

LINK DO RANKINGU ELO

 

rozmawiał Wiktor Marczuk   

Dodaj komentarz