Järjestys datasykkyrään – Tekoäly oppi visualisoimaan laajaa data-aineistoa
Ihmisaivoilla on hämmästyttävä kyky havainnoida erilaisia piirteitä jopa erittäin suurista määristä visuaalista informaatiota. Tätä kykyä hyödynnetään muun muassa tutkittaessa suuria datamassoja, joiden sisältämää informaatiota täytyy tiivistää ihmisälylle ymmärrettävään muotoon. Tämänkaltainen ulottuvuuksien pienennysongelma on keskeinen visuaalisessa analytiikassa.
FCAI:n tutkijat Aalto-yliopistosta ja Helsingin yliopistosta kokeilivat visuaalisen analytiikan tunnetuimpien menetelmien toimivuutta ja havaitsivat, ettei mikään niistä toiminut, kun datan määrä kasvoi roimasti. Esimerkiksi t-SNE, LargeViz ja UMAP eivät enää kyenneet erottelemaan datassa olevia erittäin vahvoja signaaleja havaintojen ryhmittymisestä, kun havaintoja oli satoja tuhansia.
Hiukkasfysiikalle keskeisen alkeishiukkasen, Higgsin bosonin löytämiseen liittyvien kokeiden tuottamassa aineistossa on esimerkiksi yli 11 miljoonaa piirrevektoria.
"Näistä saadut visualisoinnit muistuttivat villalankasykkyrää, eivätkä siten paljasta lainkaan aineistossa olevia huomionarvoisia hiukkasten käyttäytymiseen liittyviä ominaisuuksia", sanoo Helsingin yliopiston tilastotieteen professori Jukka Corander.
"Tämä löydös antoi sykäyksen kehittää uusi menetelmä, joka hyödyntää samoja grafiikkakiihdyttimien ominaisuuksia kuin modernit neuroverkkolaskennan tekoälymenetelmät."
Tutkijoiden kehittämä tekoälyalgoritmi pyrkii visualisoimaan aineiston niin, että sen ihmiselle helposti havainnoitavat ja ymmärrettävät makroskooppiset piirteet, kuten dataryppäät, erottuvat mahdollisimman selkeästi.
Hankkeessa menetelmää testasivat useat vapaaehtoiset ja osoittautui että algoritmin itsenäisesti valitsema ratkaisu oli usein hyvin lähellä ihmisen tyypillisimmin suosimaa ratkaisua, missä ihmisäly sijoittaa oman näkemyksensä mukaan samankaltaisista havainnoista koostuvat dataryppäät selkeästi erilleen toisistaan. Sovellettaessa menetelmää Higgsin hiukkasaineistoon tuotiin selkeästi esille aineiston tärkeimmät ominaisuudet fysiikan näkökulmasta.
”Tämä on varsinainen kvanttiloikka visuaalisen analytiikan saralla. Menetelmämme on paitsi useita kertaluokkia nopeampi kuin aiemmat menetelmät ja lisäksi sen toimintakyky on huomattavasti parempi haasteellisille sovelluksille,” sanoo Corander.
Coranderin ryhmän johdolla rakennettiin myös erillinen rajapinta menetelmän mahdollisimman tehokkaan hyödyntämisen mahdollistamiseksi genomiikan sovelluksissa. Näin käyttäjä pystyy jopa analysoimaan aineistojaan interaktiivisesti lataamalla tiedoston suoraan verkkoselaimeen. Tässä jatkotutkimuksessa havainnollistettiin maailmanlaajuisten bakteeri- ja SARS-COV2-aineistojen avulla, kuinka uudella työkalulla pystyy tarkastelemaan nopeasti jopa miljoonia genomeja ja löytämään niistä tärkeitä ominaisuuksia.
Tutkimus oli yhteistyötä FCAI:n johtajan professori Sami Kasken ja Jukka Coranderin ryhmien välillä. Hanketta vetävänä tutkijana toimi professori Zhirong Yang NTNU-yliopistosta Norjasta. Professori Yang on väitellyt Aalto yliopistosta ja toiminut myöhemmin tutkijana sekä Aallossa että Helsingin yliopistossa Coranderin ryhmässä.
Yhteyshenkilöt
Professori Jukka Corander
jukka.corander@helsinki.fi
Puhelin
0294151193
0504155294
Helsingin yliopiston mediapalvelu
Puh:02941 22622mediapalvelu@helsinki.fiLinkit
Tietoja julkaisijasta
PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Eduskuntavaalitutkimus 2023 julkistamistilaisuus 13.5. Helsingin yliopiston valtiotieteellisessä tiedekunnassa25.4.2024 11:02:23 EEST | Kutsu
Lämpimästi tervetuloa ”Pääministerivaalit polarisaation aikakaudella: Eduskuntavaalitutkimus 2023” julkistamistilaisuuteen 13.5. klo 10-12 . Nyt julkaistava eduskuntavaalitutkimuksen pääraportti on kattava teos suomalaisten äänestäjien käyttäytymisestä 2023 eduskuntavaaleissa.
Iäkkäiden lääkehoidon riskitekijöiden tunnistaminen on avainasemassa kotona asumisen tukemisessa23.4.2024 09:58:40 EEST | Tiedote
Tuoreessa väitöstutkimuksessa on kehitetty malli iäkkäiden lääkehoidon riskitekijöiden tunnistamiseksi osana laajempaa terveystarkastusta. Tutkimuksen tavoitteena oli tarjota konkreettisia keinoja iäkkäiden terveyden ja toimintakyvyn ylläpitämiseksi, jotta he voisivat asua kotona mahdollisimman pitkään.
Helsingin yliopiston operatiivinen tulos 2023 oli 16 miljoonaa euroa miinuksella17.4.2024 14:37:06 EEST | Tiedote
Varainhankinta sekä sijoitus- ja rahoitustuotot nostivat kokonaistuloksen plussalle. Yliopisto lisää sijoitustoiminnan tuotonjakoa perustehtävään seuraavien viiden vuoden ajan.
Pelastakaa tiede! -dokumenttielokuva kertoo tieteen evakuoinnin tarinan17.4.2024 10:28:01 EEST | Tiedote
Kirjailija, FT Anna Kortelainen, Kansalliskirjasto ja Kirjastokaista ovat tuottaneet yhteistyössä dokumentin, joka pureutuu Kansalliskirjaston aineistojen evakuointiin talvi- ja jatkosodan aikana. Elokuva julkaistaan 17.4.2024 Kirjastokaistan verkkosivuilla sekä Kansalliskirjaston Youtube-kanavalla.
Kutsu medialle: Tule seuraamaan Viikin tutkimustilan lehmien keväistä laitumellelaskua 4.5.!15.4.2024 14:44:21 EEST | Tiedote
Helsingin yliopisto, Valio ja maatalousylioppilaiden yhdistys Sampsa kutsuvat median edustajat osallistumaan Suomen urbaanimpien lehmien laitumellelaskuun Viikin tutkimustilalla lauantaina 4. toukokuuta.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme