Järjestys datasykkyrään – Tekoäly oppi visualisoimaan laajaa data-aineistoa
Ihmisaivoilla on hämmästyttävä kyky havainnoida erilaisia piirteitä jopa erittäin suurista määristä visuaalista informaatiota. Tätä kykyä hyödynnetään muun muassa tutkittaessa suuria datamassoja, joiden sisältämää informaatiota täytyy tiivistää ihmisälylle ymmärrettävään muotoon. Tämänkaltainen ulottuvuuksien pienennysongelma on keskeinen visuaalisessa analytiikassa.
FCAI:n tutkijat Aalto-yliopistosta ja Helsingin yliopistosta kokeilivat visuaalisen analytiikan tunnetuimpien menetelmien toimivuutta ja havaitsivat, ettei mikään niistä toiminut, kun datan määrä kasvoi roimasti. Esimerkiksi t-SNE, LargeViz ja UMAP eivät enää kyenneet erottelemaan datassa olevia erittäin vahvoja signaaleja havaintojen ryhmittymisestä, kun havaintoja oli satoja tuhansia.
Hiukkasfysiikalle keskeisen alkeishiukkasen, Higgsin bosonin löytämiseen liittyvien kokeiden tuottamassa aineistossa on esimerkiksi yli 11 miljoonaa piirrevektoria.
"Näistä saadut visualisoinnit muistuttivat villalankasykkyrää, eivätkä siten paljasta lainkaan aineistossa olevia huomionarvoisia hiukkasten käyttäytymiseen liittyviä ominaisuuksia", sanoo Helsingin yliopiston tilastotieteen professori Jukka Corander.
"Tämä löydös antoi sykäyksen kehittää uusi menetelmä, joka hyödyntää samoja grafiikkakiihdyttimien ominaisuuksia kuin modernit neuroverkkolaskennan tekoälymenetelmät."
Tutkijoiden kehittämä tekoälyalgoritmi pyrkii visualisoimaan aineiston niin, että sen ihmiselle helposti havainnoitavat ja ymmärrettävät makroskooppiset piirteet, kuten dataryppäät, erottuvat mahdollisimman selkeästi.
Hankkeessa menetelmää testasivat useat vapaaehtoiset ja osoittautui että algoritmin itsenäisesti valitsema ratkaisu oli usein hyvin lähellä ihmisen tyypillisimmin suosimaa ratkaisua, missä ihmisäly sijoittaa oman näkemyksensä mukaan samankaltaisista havainnoista koostuvat dataryppäät selkeästi erilleen toisistaan. Sovellettaessa menetelmää Higgsin hiukkasaineistoon tuotiin selkeästi esille aineiston tärkeimmät ominaisuudet fysiikan näkökulmasta.
”Tämä on varsinainen kvanttiloikka visuaalisen analytiikan saralla. Menetelmämme on paitsi useita kertaluokkia nopeampi kuin aiemmat menetelmät ja lisäksi sen toimintakyky on huomattavasti parempi haasteellisille sovelluksille,” sanoo Corander.
Coranderin ryhmän johdolla rakennettiin myös erillinen rajapinta menetelmän mahdollisimman tehokkaan hyödyntämisen mahdollistamiseksi genomiikan sovelluksissa. Näin käyttäjä pystyy jopa analysoimaan aineistojaan interaktiivisesti lataamalla tiedoston suoraan verkkoselaimeen. Tässä jatkotutkimuksessa havainnollistettiin maailmanlaajuisten bakteeri- ja SARS-COV2-aineistojen avulla, kuinka uudella työkalulla pystyy tarkastelemaan nopeasti jopa miljoonia genomeja ja löytämään niistä tärkeitä ominaisuuksia.
Tutkimus oli yhteistyötä FCAI:n johtajan professori Sami Kasken ja Jukka Coranderin ryhmien välillä. Hanketta vetävänä tutkijana toimi professori Zhirong Yang NTNU-yliopistosta Norjasta. Professori Yang on väitellyt Aalto yliopistosta ja toiminut myöhemmin tutkijana sekä Aallossa että Helsingin yliopistossa Coranderin ryhmässä.
Yhteyshenkilöt
Professori Jukka Corander
jukka.corander@helsinki.fi
Puhelin
0294151193
0504155294
Helsingin yliopiston mediapalvelu
Puh:02941 22622mediapalvelu@helsinki.fiLinkit
Tietoja julkaisijasta

PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Itämerennorppien määrästä uusi tarkempi arvio – metsästys jarruttaa kannankasvua16.7.2025 09:02:24 EEST | Tiedote
Itämerennorppakanta on kasvanut viisinkertaiseksi 1970-luvulta, jolloin pitkään jatkunut liikametsästys ja ympäristömyrkyt uhkasivat lajin tulevaisuutta. Uusi tilastollinen malli tarkentaa nyt norpan kanta-arviota.
Liito-orava on taigametsien tulevaisuuden avainlaji9.7.2025 11:26:52 EEST | Tiedote
Tuore geneettinen tutkimus paljastaa yllättäviä piirteitä liito-oravan evoluutiosta sekä vakavia huolia lajin suojelun kannalta. Kaukoidässä saattaa asustaa oma alalaji.
Noin joka seitsemäs hakija pääsi sisään Helsingin yliopistoon3.7.2025 09:42:00 EEST | Tiedote
Yhteishaussa Helsingin yliopistoon valittiin 4 703 uutta opiskelijaa. Helsingin yliopisto oli Suomen suosituin yliopisto ensisijaisten hakijoiden määrän sekä hakijoiden kokonaismäärän perusteella.
Kaasuvuoto aloittaa haavan korjauksen kasveissa2.7.2025 18:01:00 EEST | Tiedote
Helsingin yliopiston tutkijat ovat löytäneet mekanismin, jonka avulla kasvit korjaavat suojaavan uloimman kerroksensa, korkkisolukon. Tällä löydöllä voi olla merkittäviä vaikutuksia maatalouteen ja elintarvikkeiden säilyvyyteen. Etyleenin ja hapen diffuusio haavan läpi käynnistää kasvin luonnollisen paranemisprosessin.
Kaksoisvalohoito vähentää ikenien verenvuotoa ja tulehdusta hammasimplanttien ympärillä1.7.2025 09:59:32 EEST | Tiedote
Kaksoisvalohoito (Lumoral) tarjoaa kotikäyttöön turvallisen ja tehokkaan vaihtoehdon implanttien ympäristön tulehduksen hallintaan ilman antibiootteja.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme