Algoritemska napoved je lahko odličen dodatek k klasičnim vetrovnim kartam, še posebej dobro se obnese pri napovedi termičnega vetra, kjer se tradicionalno modeli, ki smo jih vajeni, slabše odrežejo.
Jaka iz Veterčka se je zadnje čase precej poglabljal v razvoj te napovedi.
Kaj sploh je algoritemska napoved?
Algoritemska napoved je bistvu statistična analiza podatkov. Beležijo se podatki relavantne vremenske postaje ter numerične napovedi za posamezne lokacije.
Pri nekaterih napovedih se uporabljajo podatki slovenskega in tudi hrvaškega aladina in francoski AROME. V model se nato združijo podatki starih napovedi ter meritev vremenskih postaj.
Natančnost modela, ki iz teh podatkov nastane, je odvisna od natančnosti podatkov vremenske postaje ter konsistence napovedi. Torej napoved ne rabi biti točna mora pa biti konstantna. Če je vsakič, ko piha 20 vozlov napoved zelo podobna, bo model zlahka dobro napovedal dejansko stanje. Kot drugje pri statistiki tudi tukaj deluje po sistemu “garbage in garbage out”. Če podatki niso kvalitetni, bo tudi napoved slaba.
Pomembno je vedeti, da v primeru algoritemske napovedi rezultat ni, koliko bo pihal veter določeni lokaciji, ampak koliko bo namerila postaja, ki je v model vključena. Torej je v resnici lahko vetra več ali manj.
Model lahko za statistično analizo uporablja različne statistične metode. V mojem primeru se je najbolje obnesla metoda t.i. ekstremno randomiziranega drevesa oz. extra tree regression, kar povprečnemu posamezniku, če ni ravno matematično in statistično navdihnjen, ne pove kaj dosti. Sam si to predstavljam kot nekakšen miselni vzorec, kot drevo, ki mu poganjajo številne korenine. Na začetku so te večje, potem pa se razcepijo v manjše. Model jim sledi in gre lahko nekako takole. Recimo, da je najbolj pomembna vlaga v zraku. Tako model začne z analizo ali je napovedana vlaga več ali manj kot 85%, če je odgovor manj, sledi levi korenini, sicer pa desni, nato sledi naslednje vprašanje, ali so napovedane padavine… In tako se lahko model “sprehaja” po številnih koreninah, dokler ne pride do tiste zadnje, ki veli, da ob takih pogojih običajno piha x vozlov in model to izbere kot napoved. Koliko takih korenin obstaja v širino in dolžino, se določi na podlagi testov. Vsekakor več korenin ni samodejno bolje, ampak je treba vse skupaj neskončno krat testirat in najti prave vrednosti.
Pri večih korenah model postane precej počasnejši, lahko pa tudi manj natančen. Recimo lahko imamo eno korenino, ki pravi, če je temperatura pod ali nad 15 st in se od tu naprej razdeli v 2 korenini, ena, ko ta pogoj drži in ena, ko ne. Za vsake pogoje imamo v bazi precej podatkov. Če imamo pa za vsako stopinjo temperature svojo korenino, je pa kar naenkrat lahko podatkov, na podlagi katerih se model odloča, precej manj. Lahko se zgodi, da je za specifične pogoje v bazi na voljo le kaka ura ali dve starih podatkov in zato je včasih bolje gledati malo bolj ohlapno, da je vključeno več podatkov. Pravo razmerje je težko ujeti.
Model sam določi kateri podatki, ki smo mu jih dali so pomembni in jih tudi ovrednoti, kateri so pomembnejši od drugih.
Pri napovedi vremena ne gre napovedovati linearno, recimo če je temperatura 5st in piha 10 vozlov to ne pomeni, da če je 10st, da bo potem pihalo 20 voz..
Zanimivo je, da ko imamo veliko podatkov, lahko sam model testiramo in približno napovemo, kako natančen bo v prihodnosti. To storimo tako, da kompletno bazo podatkov razdelimo na dva dela recimo 70-30%. En del uporabimo za kreiranje modela, drug del pa da preverimo kako natančen je model, tako da mu damo podatke, ki jih še ni “videl”. Če pa iz vseh podatkov naredimo model in potem testiramo s podatki, ki jih model že pozna bo izgledalo, da je model precej bolj natančen, kot je v resnici.
Natančnost mojih modelov (za Preluko, Barcole, Bojo, Umag…) je okoli +-2 vozla, pri slabših pa okoli 3 ali več. Zelo dobro napoveduje termične vetrove, kot npr. Preluka in Barcole pa tudi pri burji je zelo natančen, jugo je pa tako bolj muhast, tako da tam je boljši enkrat en, drugič drug model. Opažam, da je pri šibkem jugu moj model natančnejši, pri močnejših pa večkrat podcenjuje hitrost vetra in je aladin bolj natančen. Verjetno zaradi tega, ker je statistično napovedi juga manj burje pa več. Je pa tudi treba vedeti, da podatke zbiram šele nekaj več kot leto in da predvidevam, da bo čez 5-10 let natančnost še boljša.
Pred kratkim je Jaka dobil tudi dostop do jutranjega zagona modela hrvaškega aladina, tako da bo zanimivo spremljati, kako se bo ta odrezal, saj ima v primerjavi s slovenskim 4km ta 2km resolucijo. Prvi rezultati kažejo precej dobro, zelo uporabno je tudi, da hrvaški model napoveduje tudi sunke vetra, kar je včasih za surfanje bolj pomembno kot pa sama povprečna hitrost vetra. V teoriji bi morala višja resolucija bolje napovedati tudi termične vetrove, kot na primer Preluka, a v praksi še vedno ni povsem tako. Mogoče bo situacija drugačna, ko bo na voljo novi model Arsa z resolucijo 1km, ki je že nekaj časa v pripravi.
LINK: https://vetercek.com/napoved/simple.php