Oulun yliopisto

Kuvien pakkaamisesta entistä tehokkaampaa ja joustavampaa

Jaa

Tutkimuksessaan Oulun yliopiston sovelletun ja laskennallisen matematiikan professori Marko Huhtanen esittelee uuden tavan pakata eli kompressoida kuvia. Menetelmä yhdistää monia tunnettuja pakkaustekniikoita hyödyntäen niiden parhaat puolet. Hän ratkaissut sen, mihin ei aiemmin pystytty. 

Tutkimus on julkaistu IEEE Signal Processing Letters -julkaisussa. Digikuvauksessa ja kuvien tallentamisessa yleisesti käytetty tiedostomuoto on JPEG. Moni kuvaaja tallentaa kuvan myös RAW-tiedostona, jolloin kuvaa voi monipuolisemmin käsitellä jälkikäteen. Sovellutuksesta riippuen JPEG tallentaa ehkä jopa vain 10-25% informaatiosta, joka kuvaushetkellä on saatavilla. Onko menetetty informaatio merkityksellistä, riippuu tietysti katsojasta.

Jokainen joutuu tämän asian kohtaamaan; digimaailmassa se koskettaa kaikkia, jotka kuvaavat ja lähettävät kuvatiedostoja. Kuvan muodostaminen lähetettävään muotoon on aika yksinkertaista.

-Emme näe täydellistä kuvaa, koska informaatiota on oikeastaan ääretön määrä. Kuvasta on pakattava käyttöön olennainen, riittävä tieto. Se tehdään matematiikan avulla niin, että se on myös oltava toteutettavissa algoritmisesti nopeasti.

Huhtasen menetelmässä kuvaa operoidaan vertikaalisesti ja horisontaalisesti. Matemaattisesti tämä tehdään diagonaalimatriiseilla niin että kuvan approksimaatiota rakennetaan kerros kerrokselta. Prosessi muistuttaa kuuluisaa Berlekampin kytkinpeliä, mutta jatkuvassa muodossa.

-Kuvan kompressointi on kuvantamisen fundamentaalinen ongelma eli mahdollisimman pieneen tilaan pakaten pitää saada kuva siirrettyä ja jaettua nopeasti. Alkuperäinen kuva vie liian paljon tilaa, kun se laitetaan tietokoneen muistiin. Siksi kuvan informaatiosta pyritäänkin säilömään vain tuo 10-25 prosenttia.

Nykyinen JPEG teknologia pohjaa algoritmiin, jonka yhdysvaltalainen sähkötekniikan ja ohjelmoinnin professori Nazir Ahmed kehitti noin 50 vuotta sitten.

-Hän olisi halunnut tehdä pakkaamisen hienommin, niin sanottuun pääkomponenttianalyysiin pohjautuen, mutta hän ei saanut sitä toteutettua algoritmisesti. Hän teki kompromissin ja loi pakkauksen toimivalla yksinkertaisella tavalla, niin sanotulla diskreetillä kosinimuunnoksella. Hän haki tutkimukselleen rahoitusta, mutta hakemus hylättiin, koska idea miellettiin liian yksinkertaiseksi ollakseen kiinnostava.

Tutkimustulokset kuitenkin onnistuttiin julkaisemaan lehdessä ja ajan saatossa diskreetistä kosinimuunnoksesta tuli kuvan kompressoinnissa standardi.

-Tieteellisessä julkaisemisessa on paljon satunnaisuutta ja mikä on lopulta merkityksellistä, on vaikeaa ennakoida. Merkityksellisyyskin on suhteellista.

Tarkoitus kompressoinnissa on heittää niin paljon tavaraa kuvasta pois kuin mahdollista, kuitenkin niin että paljaalla silmällä ei pysty näkemään mitään eroa alkuperäisen ja kompressoidun kuvan välillä.

-JPEG on yksinkertainen tekniikka, jossa kuva ensin vain pilkotaan 64 osaan. Kukin osa sitten kompressoidaan diskreetillä kosinimuunnoksella. Menetelmä on tosiaan hyvin yksinkertainen ollakseen kiinnostava, ainakaan matemaattisesti. Käytäntö on kuitenkin osoittanut, että se toimii erinomaisesti. Ahmedin alkuperäinen idea, siis pääkomponenttianalyysi, jäi kuvan kompressoinnissa hiukan sivuraiteille.  Se tuntui olevan sekä algoritmisesti liian paljon työtä vaativa että kankea menetelmä, jota ei oikein voitu kehittää eteenpäin. Nämä kaksi lähestymistapaa ovat siis ikään kuin eläneet omaa elämäänsä. Tutkimuksessani onnistuin kuitenkin poistamaan tämän kankeuden niin, että näitä ideoita voi keskenään sekoittaa ja siten pyrkiä ottamaan molemmista parhaat puolet käyttöön. Toisin sanoen, diskreetti kosinimuunnos ja pääkomponenttianalyysi eivät olekaan algoritmisesti eristyksissä toisistaan.

Professori Marko Huhtanen ei itse lähde ennustamaan ideoidensa sovellettavuutta tai leviämistä mutta hän on kuitenkin ratkaissut sen, mihin ei aiemmin pystytty. On kehitetty laaja algoritmiperhe josta kuuluisa pääkomponenttianalyysi on vain yksi erikoistapaus. Se mistä lopulta parhaat sovellusalueet löytyvät jää nähtäväksi. 

Mitä tarkoittaa pääkomponenttianalyysi kuvan kompressoinissa? Tätä havainnollistaa Tim Baumanin sivullaan demoama esimerkki, miten kuvasta saadaan tarkempi mukaan otettavan informaation kasvaessa. Jossain vaiheessa silmä ei näe enää eroa vaikka kuvassa mukana oleva informaatio kasvaa. Tämä on siis Ahmedin alun perin visioima kompressointitekniikka joka nykyisin osataan toteuttaa.

Filmille kuvanneet muistavat negatiivit. Filmianalogian esimerkillä havainnollistaen voidaan todeta, että digitaalikuvien pakkauksessa kuva muutetaan ikään kuin negatiiviksi, josta otetaan tarvittavat palaset ja ne muutetaan näkyvän kuvan muotoon. Vastaanottaja saa niin sanotun negatiivimuodon, ja se kääntyy hänelle näkyvään muotoon.

Jokainen meistä on kokenut pätkivän netin yhteysongelmia ja sen, kuinka jokin kuva tai sivusto rakentuu hitaasti silmien edessä näytölle.

- Kanavaa pitkin tulee yksittäisiä komponentteja, jolloin kuva tarkentuu pakkauksen purkautuessa. Jos tuo pystytään tekemään nykyistä paremmin, kuvien siirto nopeutuu ja informaatiota voidaan välittää enemmän. Digitaalinen kuva koostuu pikseliriveistä, jotka ovat lopulta numeroita. Lähetettyjen numeroiden määrän leikkaus on siis hyvin keskeinen asia pohdittavaksi.

Huhtasen kehittämä menetelmä mahdollistaa kuvan tiivistämisen pienempään määrään tietoa, mikä säästää tallennustilaa ja nopeuttaa siirtoa. Laskenta nopeutuu ja kevenee ja soveltuu hyvin rinnakkaiseen tiedon käsittelyyn. Kuvaa voidaan rakentaa vaiheittain, mikä mahdollistaa tarkemman hallinnan ja säätämisen pakkausprosessissa. Energiaakin säästyy.

Marko Huhtasen tutkimuspaperi löytyy kokonaisuudessaan IEEE:n julkaisusta Signal Processing Letters.

Switching Games for Image Compression | IEEE Journals & Magazine | IEEE Xplore

Avainsanat

Yhteyshenkilöt

Kuvat

Linkit

Tietoja julkaisijasta

Oulun yliopisto on monitieteinen, kansainvälisesti toimiva tiedeyliopisto. Tuotamme uutta tietoa ja ratkaisuja kestävämmän tulevaisuuden rakentamiseksi sekä koulutamme osaajia muuttuvaan maailmaan. Tärkeimmissä yliopistovertailuissa Oulun yliopisto sijoittuu kolmen prosentin kärkeen maailman yliopistojen joukossa. Meitä yliopistolaisia on noin 17 000.

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Oulun yliopisto

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme
World GlobeA line styled icon from Orion Icon Library.HiddenA line styled icon from Orion Icon Library.Eye