Helsingin yliopisto

Automaattinen sisällönkuvailu osaksi Finton palveluja

Jaa
Finto laajenee automaattisen sisällönkuvailun palveluihin Finto AI -työkalun ja sen rajapintapalvelun myötä. Palvelu tukee suomen-, ruotsin- ja englanninkielisen tekstin automaattista sisällönkuvailua.

Finto AI on saatavilla osoitteessa ai.finto.fi, josta löytyvän lomakkeen avulla palvelua voi kokeilla ja käyttää. Automaattinen sisällönkuvailu toimii parhaiten opinnäytetyö- ja tietokirja-aineistoissa.

Finto on suomalainen sanasto- ja ontologiapalvelu, joka on jo yli kuuden vuoden ajan tukenut sisällönkuvailutyötä tarjoamalla pääsyn keskeisiin sanastoihin ja ontologioihin. Finto AI tuo koneoppimisen ja kieliteknologian tarjoamia mahdollisuuksia työkaluiksi perinteiseen sisällönkuvailutyöhön. Palvelun taustalla on Kansalliskirjastossa kehitetty työkalu Annif, jota on useiden vuosien ajan kehitetty kokeellisena palveluna. 

Annif on jo käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaista käyttöä pilotoidaan tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa. 

Myös Kirjavälitys Oy käyttää rajapintapalvelua vielä julkaisemattomien kirjojen asiasanoitukseen kustantajan esittelytekstin pohjalta. “Annif on tuttavuutemme aikana kehittynyt selvästi, ja sen seuraaminen on ollut todella mielenkiintoista. Erityisesti tietokirjojen esittelyteksteihin perustuvaan asiasanoitukseen se pystyy usein tarjoamaan YSO-termejä tarkasti, melko usein myös kattavasti”, kertoo Anna Tuominen Kirjavälityksen tuotetietopalveluista. Yleinen suomalainen ontologia YSO on kolmikielinen (suomi, ruotsi, englanti) ontologia, eli käsitehierarkiaa, joka kuvaa jonkin aihealueen käsitteet ja niiden väliset suhteet koneymmärrettävässä muodossa. Se koostuu pääasiassa yleiskäsitteistä mutta sisältää runsaasti myös eri alojen erikoiskäsitteistöä, on rakennettu suomalaisen kulttuuripiirin sisällönkuvailutarpeiden ja käsitteistön pohjalta, ja on tarkoitettu käytettäväksi kuvailuun erityisesti silloin, kun kuvailtavien aineistojen aihealueet ovat monipuolisia.

Automaattista sisällönkuvailua erilaisilla sanasto- ja kieliyhdistelmillä ja monentyyppisillä aineistoilla on jo pitkään kokeiltu Annifin kehityksen osana. Tällä hetkellä käytössä oleva toiminnallisuus perustuu useiden algoritmien yhdistelmään, jolla on saatu hyviä tuloksia. Koneoppimisalgoritmeja on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty näiden algoritmien ehdotusten hienosäätöön. 

Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.

Katso esittelyvideo: https://youtu.be/ZKN22mXKMm8

Lisää aiheesta:

Lehtinen M, Inkinen J & Suominen O (2019). Aaveita koneessa: Automaattisen sisällönkuvailun arviointia Kirjastoverkkopäivillä 2019.Tietolinja, 2019(2). Pysyvä osoite:http://urn.fi/URN:NBN:fi-fe2019120445612

Finto-palvelu http://finto.fi/fi/

Lisätietoja:

Mona Lehtinen, tietoasiantuntija, Automaattinen kuvailu

Juho Inkinen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

Osma Suominen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

etunimi.sukunimi@helsinki.fi

Avainsanat

Tietoja julkaisijasta

Kansalliskirjasto vastaa kansallisen kulttuuriperinnön tallettamisesta, säilyttämisestä ja käyttöön saattamisesta. Kirjasto toimii tutkimuskirjastona erityisesti humanistis-yhteiskuntatieteellisillä aloilla ja on merkittävä kulttuuriperintödatan käyttöön asettaja. Strategiansa mukaisesti Kansalliskirjasto edistää avointa tiedettä ja digitalisaatiota.

Kansalliskirjasto on osa Helsingin yliopistoa, yli 40 000 opiskelijan ja työntekijän kansainvälistä tiedeyhteisöä. Vuonna 1640 perustettu Helsingin yliopisto kuuluu maailman parhaiden monitieteisten tutkimusyliopistojen joukkoon.

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Helsingin yliopisto

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme
HiddenA line styled icon from Orion Icon Library.Eye