Jyväskylän yliopisto

Tekoäly ei tarvitse syväoppimista - yksinkertaisemmat mallit tuottavat parempia tuloksia

Jaa

Jyväskyläläistutkijat yksinkertaistivat tekoälyä 1700-luvun matematiikan avulla. Tutkijoiden mukaan perinteiset matemaattiset optimointimenetelmät toimivat yksinkertaisen tekoälyn kouluttamisessa paremmin, kuin 2000-luvulla kehitetty syväoppiminen. Yksinkertaisempi tekoäly on myös eettisesti ja ympäristöllisesti kestävämpi.

Kuvassa henkilö käyttää kännykällä ChatGPT-tekoälyä.
Tutkijoiden mukaan muun muassa ChatGPT:n käyttämät syväoppimismallit ovat raskaita ja vaikeasti hahmotettavia. Kuva: Mostphotos Mostphotos Vapaasti käytettävissä. Kuvan lähde mainittava.

Tekoälyn viimeaikainen menestys perustuu keskeisesti yhteen koneoppimistekniikkaan: syväoppimiseen. Syväoppimisella tarkoitetaan sellaisia tekoälymenetelmiä, jotka hyödyntävät lukuisia neuroverkkokerroksia ja massiivisten aineistojen prosessointia, jonka avulla verkot ns. opetetaan eli saatetaan käyttökuntoon.

Syväoppimista käytetään erityisesti, kun tietokonetta opetetaan ratkaisemaan vaativia tehtäviä, kuten esimerkiksi tuottamaan uusia sisältöjä, ohjaamaan autoja ja robotteja tai vaikkapa pelaamaan monimutkaisia strategiapelejä. Syväoppimismallit ovat viime aikoina tulleet ihmisille tutuksi esimerkiksi chatGPT:n myötä, vaikka ne ovat käytössä paljon laajemmin.

Professori Tommi Kärkkäinen ja väitöskirjatutkija Jan Hänninen tutkivat Jyväskylän yliopistossa itseoppivia menetelmiä ja saivat kuusi vuotta sitten yllättäviä tuloksia, joiden mukaan syväoppimisen ydintä, monimutkaisia neuroverkkorakenteita, ei välttämättä tarvita. Parempia tuloksia saadaan aikaan yhdistämällä yksinkertaisia verkkorakenteita uudella tavalla.

– Syväoppimismenetelmien käyttö on aina hyvin monimutkainen ja virhealtis savotta. Tämä tekee malleista väistämättä raskaita ja vaikeasti hahmotettavia. Uusi neuroverkkojen mallimme on ilmaisuvoimaisempi ja pystyy merkittävästi tiivistämään laajoja tietoaineistoja, Kärkkäinen kuvailee tutkimustuloksia.

Uuden tekoälyn rakenne pohjautuu 1700-luvun matematiikkaan. Kärkkäisen ja Hännisen mukaan myös perinteiset 1960- ja 1970-luvuilla esitetyt matemaattiset optimointimenetelmät toimivat yksinkertaisemman tekoälyn opettamisessa jopa paremmin kuin 2000-luvun syväoppiminen.

– Tulostemme perusteella neuroverkkojen soveltamisesta erilaisiin tehtäviin tulee entistäkin helpompaa ja luotettavampaa, toteaa väitöskirjatutkija Hänninen.

Yksinkertaisemmat mallit tarkoittavat eettisempää ja vihreämpää tekoälyä

Kärkkäinen ja Hänninen kertovat, että yksinkertaisempi verkkorakenne mahdollistaa helpomman käyttöönoton ja paremman ymmärrettävyyden. Tekoälystä on tullut osa lähes kaikkea modernia teknologiaa ja siksi on tärkeää ymmärtää, mitä ja millä tavalla se tekee asioita.

– Mitä läpinäkyvämpi ja yksinkertaisempi tekoäly on, sitä helpompaa on tarkastella sen käytön eettisiä näkökulmia. Vaikkapa lääketieteen sovelluksissa syväoppimismalleja ei voida laajasti hyödyntää, koska potilasturvallisuutta ei voi varmasti arvioida, Kärkkäinen toteaa.

Tutkijat nostavat esille myös sen, että yksinkertaisemmat mallit säästävät resursseja eli kuluttavat esimerkiksi vähemmän sähköä ja ovat näin ympäristöystävällisempiä.

Tutkijat ovat kokeneet, että valtavirran käsityksistä poikkeavan tutkimuksen julkaiseminen on ollut vuosia kestävä tuskaisa prosessi.

– Syväoppiminen on ollut tutkimuksessa, kehityksessä ja liiketoiminnassa keskeinen tekniikka jo pidemmän aikaa. Tuntuu, että valtavirtaa vastaan uiminen on tieteessäkin haastavaa, kun kuuluisat tutkijat ja heidän verkostonsa puolustavat omia tutkimusintressejään.

Nyt jyväskyläläistutkijoiden artikkeli on julkaistu neurolaskenta-alan korkeatasoisessa Neurocomputing-julkaisusarjassa.

– Odotamme mielenkiinnolla, miten tulokset otetaan vastaan tiedeyhteisössä ja koneoppimismenetelmien hyödyntäjien parissa teollisuudessa. Itse otamme uudet menetelmät käyttöön ainakin resurssiviisaan vetytalouden, älykkäiden oppimisen ympäristöjen sekä luotettavan terveys- ja hyvinvointiteknologian monitieteisissä kehityshankkeissamme, Kärkkäinen summaa.

Lisätietoja

Tommi Kärkkäinen
Professori, Informaatioteknologian tiedekunta
tommi.karkkainen@jyu.fi
+358 40 8054896

Jan Hänninen
Väitöskirjatutkija
jan.p.hanninen@jyu.fi

Julkaisutiedot

Kärkkäinen, T., & Hänninen, J. (2023). Additive autoencoder for dimension estimation. Neurocomputing, 126520. https://doi.org/10.1016/j.neucom.2023.126520

Avainsanat

Yhteyshenkilöt

Kuvat

Jyväskylän keskustassa sijaitsevan yliopiston kauniilla puistokampuksella sykkii monitieteinen ja moderni tiedeyliopisto – ihmisläheinen ja dynaaminen yhteisö, jonka 2500 asiantuntijaa ja 15 000 opiskelijaa etsivät ja löytävät vastauksia huomisen kysymyksiin. Jyväskylän yliopisto on ollut tulevaisuuden palveluksessa jo vuodesta 1863, jolloin suomenkielinen opettajankoulutus sai alkunsa täältä. Voimanlähteenämme on moniarvoinen vuoropuhelu tutkimuksen, koulutuksen ja yhteiskunnan välillä. Vaalimme tutkimuksen ja koulutuksen tasapainoa sekä ajattelun avoimuutta – sytytämme taidon, tiedon ja intohimon elää viisaasti ihmiskunnan parhaaksi. www.jyu.fi

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Jyväskylän yliopisto

Väitös 6.10.2023: Johtamismotivaatio on tärkeä voimavara kestävän johtajauran rakentumiselle (Auvinen)29.9.2023 14:00:00 EEST | Tiedote

PsM Elina Auvisen psykologian laitoksen väitöskirjassa tutkitaan suomalaisten johtajien kestävien työurien rakentumista. Keskeinen kysymys oli, auttaako johtajan johtamismotivaatio rakentamaan kestävää työuraa nykyisessä työelämäkontekstissa. Lisäksi tutkimuksessa tarkastellaan johtotehtävissä toimimisen taustalla vaikuttaneita syitä ja johtamismotivaation kykyä toimia voimavarana johtajan työuupumusta vastaan.

Kuluttajan älypuhelintaidoilla vaikutusta palvelukokemukseen verkko- ja kivijalkakaupan välillä29.9.2023 07:00:00 EEST | Tiedote

Jyväskylän yliopiston tietojärjestelmätieteen oppiaineen ja yhteiskuntatieteiden ja filosofian laitoksen tutkimuksessa osoitettiin, että älypuhelinta ostoksien teossa hyödyntävät kuluttajat hyötyvät eniten verkko- ja kivijalkaliikkeen eli fyysisen myymälätilan yhdistelmästä. Nämä kuluttajat ovat myös muita uskollisempia kaupoille, jotka ovat yhdistäneet palvelussaan verkon ja kivijalan onnistuneesti.

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme