Järjestys datasykkyrään – Tekoäly oppi visualisoimaan laajaa data-aineistoa
Ihmisaivoilla on hämmästyttävä kyky havainnoida erilaisia piirteitä jopa erittäin suurista määristä visuaalista informaatiota. Tätä kykyä hyödynnetään muun muassa tutkittaessa suuria datamassoja, joiden sisältämää informaatiota täytyy tiivistää ihmisälylle ymmärrettävään muotoon. Tämänkaltainen ulottuvuuksien pienennysongelma on keskeinen visuaalisessa analytiikassa.
FCAI:n tutkijat Aalto-yliopistosta ja Helsingin yliopistosta kokeilivat visuaalisen analytiikan tunnetuimpien menetelmien toimivuutta ja havaitsivat, ettei mikään niistä toiminut, kun datan määrä kasvoi roimasti. Esimerkiksi t-SNE, LargeViz ja UMAP eivät enää kyenneet erottelemaan datassa olevia erittäin vahvoja signaaleja havaintojen ryhmittymisestä, kun havaintoja oli satoja tuhansia.
Hiukkasfysiikalle keskeisen alkeishiukkasen, Higgsin bosonin löytämiseen liittyvien kokeiden tuottamassa aineistossa on esimerkiksi yli 11 miljoonaa piirrevektoria.
"Näistä saadut visualisoinnit muistuttivat villalankasykkyrää, eivätkä siten paljasta lainkaan aineistossa olevia huomionarvoisia hiukkasten käyttäytymiseen liittyviä ominaisuuksia", sanoo Helsingin yliopiston tilastotieteen professori Jukka Corander.
"Tämä löydös antoi sykäyksen kehittää uusi menetelmä, joka hyödyntää samoja grafiikkakiihdyttimien ominaisuuksia kuin modernit neuroverkkolaskennan tekoälymenetelmät."
Tutkijoiden kehittämä tekoälyalgoritmi pyrkii visualisoimaan aineiston niin, että sen ihmiselle helposti havainnoitavat ja ymmärrettävät makroskooppiset piirteet, kuten dataryppäät, erottuvat mahdollisimman selkeästi.
Hankkeessa menetelmää testasivat useat vapaaehtoiset ja osoittautui että algoritmin itsenäisesti valitsema ratkaisu oli usein hyvin lähellä ihmisen tyypillisimmin suosimaa ratkaisua, missä ihmisäly sijoittaa oman näkemyksensä mukaan samankaltaisista havainnoista koostuvat dataryppäät selkeästi erilleen toisistaan. Sovellettaessa menetelmää Higgsin hiukkasaineistoon tuotiin selkeästi esille aineiston tärkeimmät ominaisuudet fysiikan näkökulmasta.
”Tämä on varsinainen kvanttiloikka visuaalisen analytiikan saralla. Menetelmämme on paitsi useita kertaluokkia nopeampi kuin aiemmat menetelmät ja lisäksi sen toimintakyky on huomattavasti parempi haasteellisille sovelluksille,” sanoo Corander.
Coranderin ryhmän johdolla rakennettiin myös erillinen rajapinta menetelmän mahdollisimman tehokkaan hyödyntämisen mahdollistamiseksi genomiikan sovelluksissa. Näin käyttäjä pystyy jopa analysoimaan aineistojaan interaktiivisesti lataamalla tiedoston suoraan verkkoselaimeen. Tässä jatkotutkimuksessa havainnollistettiin maailmanlaajuisten bakteeri- ja SARS-COV2-aineistojen avulla, kuinka uudella työkalulla pystyy tarkastelemaan nopeasti jopa miljoonia genomeja ja löytämään niistä tärkeitä ominaisuuksia.
Tutkimus oli yhteistyötä FCAI:n johtajan professori Sami Kasken ja Jukka Coranderin ryhmien välillä. Hanketta vetävänä tutkijana toimi professori Zhirong Yang NTNU-yliopistosta Norjasta. Professori Yang on väitellyt Aalto yliopistosta ja toiminut myöhemmin tutkijana sekä Aallossa että Helsingin yliopistossa Coranderin ryhmässä.
Yhteyshenkilöt
Professori Jukka Corander
jukka.corander@helsinki.fi
Puhelin
0294151193
0504155294
Helsingin yliopiston mediapalvelu
Puh:02941 22622mediapalvelu@helsinki.fiLinkit
Tietoja julkaisijasta

PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Yhteenkuuluvuuden ja jatkuvuuden säilyttämisen kokemus avaintekijöitä muistisairauteen sopeutumisessa13.5.2025 08:30:00 EEST | Tiedote
Työikäisenä muistisairauteen sairastuneiden sopeutumista kuten myös heidän läheistensä sopeutumista sairauteen vaikuttaa se, miten sairaus muuttaa arjessa toimimista, kuinka sairastuneet ja läheiset pystyvät säilyttämään jatkuvuuden kokemusta sekä millaiseksi heidän välinen yhteenkuuluvuus muuntuu. Tiedot ilmenevät Helsingin yliopistossa tarkastettavasta väitöstutkimuksesta.
Synnyttäjät kokevat hyvinvointimittarit tärkeinä mutta riittämättöminä13.5.2025 07:30:00 EEST | Tiedote
Henkisen jaksamisen kartoittamisen pitäisi synnyttäjien mielestä olla kattavampaa.
KUTSU: Ydinturvallisuus, pelko ja Ukrainan kriisi puhututtavat Tiedekulmassa 14.5.12.5.2025 12:39:32 EEST | Kutsu
Helsingin yliopisto ja Säteilyturvakeskus järjestävät asiantuntijaseminaarin ydinturvallisuudesta ja Ukrainan kriisistä Tiedekulmassa keskiviikkona 14.5. kello 17-19, Yliopistonkatu 4:ssä.
Lupaava uusi menetelmä hopean irrottamiseen elektroniikkajätteistä – munkkirasva liuottaa ja erottelee hopean romusta12.5.2025 06:00:00 EEST | Tiedote
Rasvahapot toimivat liuottimena. Prosessi vaatii lisäksi valoa ja laimennettua vetyperoksidia. Uuden menetelmän myötä voidaan turvata hopean saanti ja vähentää ympäristön kuormitusta.
Missä ovat pääkaupunkiseudun monimuotoisimmat ja saavutettavimmat viheralueet?9.5.2025 06:50:00 EEST | Tiedote
Tuoreen tutkimuksen tulokset osoittavat, että viheralueet, jotka ovat tärkeitä luonnon monimuotoisuuden kannalta, eivät aina ole samoja kuin ne, jotka ovat tärkeitä saavutettavuuden kannalta. Uudet menetelmät auttavat tunnistamaan viheralueiden merkittävyyden eri näkökulmista.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme