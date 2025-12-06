"Kun ensimmäiset suuret kielimallit koulutettiin, niitä koulutettiin aidolla kirjallisella perinnöllä, kuten tieteelliset julkaisut, kirjallisuus ja Wikipedia", Laakso kertoo.

"Nyt tilanne on kuitenkin muuttunut. Kun yhä enemmän tekoälyn tuottamaa sisältöä leviää verkkoon, sitä päätyy tulevien mallien koulutusdataksi ihmisten tuottaman datan sijaan", Laakso kuvaa. Tutkijat ovat antaneet ilmiölle nimen "model collapse", mallin romahdus.

Nature-lehden tutkimuksessa kielimallia jatkokoulutettiin sen omilla tuotoksilla, minkä seurauksena yhdeksän kierroksen jälkeen tekoäly tuotti "pelkkää hölynpölyä". Tulosta on kutsuttu myös "tekoälyn kannibalismiksi" tai "Habsburg-tekoälyksi".

"Se tarkoittaa, että ensin malli menettää tietoa harvinaisista, mutta tärkeistä tapauksista, mitä on vaikea huomata, koska mallin yleinen suorituskyky voi jopa näyttää paranevan. Myöhemmin datajakauma supistuu kuitenkin niin, ettei se enää muistuta alkuperäistä", Laakso selittää.

Tuhoisia seurauksia kriittisillä aloilla, mutta mallien jäädytys ei ratkaise

Ilmiöllä voi luonnollisesti olla laajat vaikutukset eri aloilla.

Terveydenhuollossa tekoäly saattaa "unohtaa" harvinaiset tapaukset ja lakkaa tunnistamasta epätyypillisiä oireita. Yhdysvalloissa Wells Fargon tekoälyvirhe asuntolainajärjestelmässä johti siihen, että yli 500 ihmistä menetti kotinsa. Tekoälyohjattu vesijakelulaitos voi datamyrkytyshyökkäyksen seurauksena aiheuttaa vakavia seurauksia miljoonille. Vuonna 2024 kyberhyökkäykset kriittistä infrastruktuuria vastaan kasvoivat 30 prosenttia ja samaan aikaan tekoälyyn liittyvät yksityisyysloukkaukset kasvoivat yli 56 prosenttia.

"Mallien jäädytys ei kuitenkaan tilannetta ratkaise, sillä jäädytetty malli voi vanheta nopeasti, kuten esimerkiksi rahoitusalalla", Laakso sanoo.

EU-säädös määrittelee riskejä

EU:n tekoälysäädöksessä määritellään neljä riskitasoa tekoälyjärjestelmille. Korkean riskin järjestelmille on tiukkoja vaatimuksia koskien riskinarviointia, datan laatua, dokumentointia, läpinäkyvyyttä, ihmisvalvontaa ja tarkkuutta.

EU-säädös ja Yhdysvaltain vastaava AI Bill of Rights korostavat jatkuvan seurannan tarvetta. Rahoitus- ja terveydenhuoltoaloilla sääntelyviranomaiset vaativat säännöllisiä auditointeja sen varmistamiseksi, että mallit pysyvät tarkkoina eri väestöryhmissä.

"Laki siis edellyttää mallien päivittämistä, mutta juuri päivitysprosessi voi johtaa mallien romahdukseen", Laakso pohtii.

Hämärtyvät vastuut

"Olemassa olevat kansalliset vastuusäännöt, erityisesti tuottamukseen perustuvat, eivät sovellu käsittelemään tekoälyn aiheuttamia vahingonkorvausvaatimuksia, Laakso sanoo. "Sääntöjen mukaan uhrien on todistettava vahingon aiheuttaneen henkilön virheellinen teko tai laiminlyönti."

Vastuu laajenee kattamaan paitsi alkuperäiset valmistajat myös yritykset ja käyttöönottajat, jotka olennaisesti muokkaavat tuotetta. Mikä tahansa tekoälyjärjestelmien käyttöönotossa mukana oleva taho voidaan saattaa vastuuseen, jos sen toimet myötävaikuttavat vikaan.

"Kun malli rapautuu useiden päivityskierrosten aikana, virhe ei synny vain yhdestä teosta, vaan pitkästä ketjusta pieniä heikkenemisiä, jolloin vastuun osoittaminen on lähes mahdotonta", Laakso kuvailee.

"Tekoäly on tuonut erittäin nopeasti suuren joukon uusia haasteita päivittäiseen elämäämme ja myös sellaisia, joilla on laajat vaikukset ihmisten ja organisaatioiden tietoturvaan", Laakso toteaa.