Koneoppiminen revontulien ennustamisessa

Opinnäytetyö Simuloitu tunnistusmalli revontulien paikallisen näkyvyyden ennustamiseen on Nelli Hännisen Lapin ammattikorkeakoulun tieto- ja viestintätekniikan tutkinto-ohjelman insinööri (AMK) -työ vuodelta 2025. Opinnäytetyön tavoitteena oli kehittää simuloitu koneoppimismalli, joka tuottaa teoreettisen ennusteen revontulien paikallisesta näkyvyydestä Rovaniemellä. Työ toteutettiin osana Lapin tekoälykiihdyttämö -hanketta.

Tavoitteet

Opinnäytetyön tavoitteena oli kokeellisesti testata, kuinka tekoäly- ja koneoppimismenetelmiä voidaan soveltaa revontuliennusteen rakenteen kehittämiseen, ja arvioida mallin teoreettista toimivuutta demoversiossa. Työssä tarkasteltiin erityisesti mallin soveltuvuutta epätasapainoiseen ja aikasarjamuotoiseen aineistoon sekä tunnistettiin menetelmien rajoitteita ja kehityskohteita ennen todellisten havaintoaineistojen käyttöä.

Välineet

Työssä hyödynnettiin Python-ohjelmointikieltä sekä keskeisiä data-analytiikan ja koneoppimisen kirjastoja, kuten pandasia, NumPyä ja scikit-learnia. Mallinnuksessa käytettiin Random Forest -algoritmia, ja tulosten tulkintaa tuettiin ominaisuuksien tärkeysanalyyseilla. Aineisto muodostettiin yhdistämällä Ilmatieteen laitoksen säämuuttujia ja NOAA:n avaruussäämittauksia. Demosovellus toteutettiin Streamlit-kirjaston avulla.

Prosessi

Työ toteutettiin toiminnallisella kehittämismenetelmällä, jossa hyödynnettiin koneoppimismalleja, kuten päätöspuita ja satunnaismetsiä. Prosessi eteni aineiston keruusta ja esikäsittelystä koneoppimismallin rakentamiseen, arviointiin ja tulosten analysointiin. Mallia testattiin sääntöperusteisesti simuloidulla tavoitemuuttujalla, jotta sen toimintaperiaatetta voitiin arvioida ilman todellisia revontulihavaintoja. Erityistä huomiota kiinnitettiin tietovuodon ehkäisyyn ja mallin arviointiin useilla suorituskykymittareilla.

Tulokset

Tulokset osoittivat, että koneoppimismalli pystyi tunnistamaan revontulien esiintymiseen liittyviä keskeisiä fysikaalisia ilmiöitä, kuten aurinkotuulen ja geomagneettisen aktiivisuuden vaikutuksia. Mallin tekninen suorituskyky oli simuloidussa ympäristössä virheetön, mutta työ toi esiin simuloidun lähestymistavan rajoitteet todellisessa ennustamiskäytössä. Työn tuloksena syntyi web-pohjainen Streamlit-demoversio, joka visualisoi ennusteen karttanäkymänä ja tuottaa käyttäjälle yksinkertaisen GO/NO GO -suosituksen.

Opinnäytetyö osoittaa, että koneoppimisen periaatteita voidaan soveltaa onnistuneesti revontulien näkyvyyden arviointiin teoreettisella tasolla ja että vastaavaa rakennetta voidaan jatkossa kehittää ja validoida todellisilla havaintoaineistoilla esimerkiksi matkailun ja ympäristötiedon digitaalisissa palveluissa.

Linkki Theseukseen: https://urn.fi/URN:NBN:fi:amk-2025120231649