Tekoäly apuna koltansaamen ja pohjoissaamen digitaalisten sanakirjojen toimitustyössä
24.8.2020 05:30:00 EEST | Oulun yliopisto | Tiedote
Sanakirjojen kehitys ja niiden digitalisointi ovat osa vähemmistökielten kuvausta ja elvytystä. Digitalisoinnin ansiosta kieliä voidaan nykyaikaistaa ja käännettyjen sanojen määrää lisätä verrattuna painettuihin sanakirjoihin. Digitaalisessa muodossa olevaa sanakirjaa on helppo täydentää, laajentaa ja korjata sitä mukaa kuin tiedot kielen sanavaroista ja kirjakielen normeista täsmentyvät.
Esimerkiksi koltansaame on kehittyvä kirjakieli, jonka kirjallinen käyttö on viime vuosina laajentunut uusille alueille. Sanasto on merkittävästi kasvanut, ja sen uudistuminen on ollut erityisen nopeaa viimeisen vuosikymmenen aikana.
Oulun yliopistossa on aloitettu tänä vuonna koltansaamen pääaineopetus.
”Koltansaamen digitaalisen sanakirjan merkitys on erittäin suuri. Näin ajantasaista, nykykieltä sisältävää sanakirjaa ei koltansaamessa ole lainkaan. Digitaalisen sanakirjan julkaiseminen on merkittävä edistysaskel myös opetuksen kannalta. Tärkeää on myös se, että kolttasaamelaiset itse ovat olleet mukana tekemässä tätä työtä”, Giellagas-instituutin johtaja Anni-Siiri Länsman toteaa.
Digitaalisten sanakirjojen toteutuksessa on käytetty pienten kielten sanakirjatyötä varten Helsingin yliopistossa kehitettyä Veʹrdd-työkalua. Työkalu hyödyntää tekoälyä, joka muun muassa taivuttaa sanoja automaattisesti eri muotoihin. Tekoäly säästää sanakirjatyöhön kuluvaa aikaa, sillä jokaisen sanan kaikkia taivutusmuotoja ei tarvitse kirjoittaa käsin. Käyttäjällä on myös mahdollisuus korjata tekoälyn tuottamia virheellisiä muotoja.
Sanakirjan koneluettavuus mahdollistaa sen, että korjaukset voidaan syöttää takaisin tekoälylle, jolloin sen käsitys kielen taivutusmuodoista tarkentuu. Samaa tekoälyä ja Ve’rddillä tuotettua sanastoa voidaan käyttää suoraan myös oikolukusovelluksissa ja kielenopetusohjelmissa.
Digitaalisessa suomi–koltansaame-sanakirjassa suomenkielisten hakusanojen määrä on yli 16 000 ja koltankielisten vastineiden lähes 19 000. Digitaalisessa pohjoissaame–suomi-sanakirjassa on runsaat 50 000 hakusanaa. Sen käsikirjoituksen on tehnyt emeritusprofessori Pekka Sammallahti aikaisempien sanakirjojensa (1989 ja 1993) pohjalta.
Digitaaliset sanakirjat julkaistaan Tromssan yliopiston saamen kieliteknologian keskuksen Giellateknon ja Divvun-projektin alustalla:
suomi–koltansaame-sanakirja https://saan.oahpa.no/fin/sms/
pohjoissaame–suomi-sanakirja http://satni.org/sammallahtismefin
Digitaalisten sanakirjojen julkaisutilaisuus pidetään 25.8.2020 klo 10 ja sitä voi seurata osoitteessa https://oulu.zoom.us/j/69319349687
Molempien sanakirjojen toimitustyö on tehty pääosin opetus- ja kulttuuriministeriön Oulun yliopiston Giellagas-instituutille myöntämän erityisrahoituksen turvin. Suomi–koltansaame-sanakirjan toteutus on Oulun yliopiston Giellagas-instituutin, Helsingin yliopiston, Tromssan yliopiston ja Saamelaiskäräjien yhteistyötä.
Giellagas-instituutilla on valtakunnallinen vastuu järjestää ja edistää saamen kielen ja saamelaisen kulttuurin ylintä opetusta ja tutkimusta Suomessa.
Avainsanat
Yhteyshenkilöt
Lisätietoja:
johtaja Anni-Siiri Länsman, Giellagas-instituutti, Oulun yliopisto, p. 040 5143781, anni-siiri.lansman@oulu.fi
yliopisto-opettaja Miika Lehtinen, Giellagas-instituutti, Oulun yliopisto, p. 050 5692300, miika.lehtinen@oulu.fi
viestintäasiantuntija Anna-Maria Hietapelto, p. 040 7650015, Oulun yliopisto, anna-maria.hietapelto@oulu.fi
Linkit
Tietoja julkaisijasta
Oulun yliopisto on monitieteinen, kansainvälisesti toimiva tiedeyliopisto. Tuotamme uutta tietoa ja ratkaisuja kestävämmän tulevaisuuden rakentamiseksi sekä koulutamme osaajia muuttuvaan maailmaan. Tärkeimmissä yliopistovertailuissa Oulun yliopisto sijoittuu kolmen prosentin kärkeen maailman yliopistojen joukossa. Meitä yliopistolaisia on noin 17 000.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Oulun yliopisto
Laajennettu todellisuus mullistaa opiskelua terveysalalla – virtuaalitilanteet vähentävät stressiä ja parantavat oppimista2.3.2026 05:55:00 EET | Tiedote
Oulun yliopistossa ja Lapin ammattikorkeakoulussa kehitetty ihmislähtöinen XR-teknologia tarjoaa uuden ratkaisun terveysalan koulutuksen haasteisiin. Virtuaaliset kliiniset tilanteet voivat vähentää opiskelijoiden kuormitusta ja vahvistaa valmiuksia toimia tehokkaasti moniammatillisissa tiimeissä, kertoo tuore tutkimus.
Tutkimus: liikennemelu yhteydessä korkeampiin veren kolesteroli- ja rasva‑arvoihin25.2.2026 05:45:00 EET | Tiedote
Vilkkaiden teiden läheisyydessä asuminen saattaa häiritä muutakin kuin unta, sillä se voi vaikuttaa myös elimistön rasva-aineenvaihduntaan.
Suomen puolustus- ja turvallisuusalan verkostossa oululaisella teknologiaosaamisella merkittävä rooli23.2.2026 07:07:00 EET | Tiedote
DEFINE on Riihimäen kaupungin kehittämä puolustus- ja turvallisuusalan verkosto ja toimintamalli, joka kokoaa yhteen alan osaajat, yritykset ja testausympäristöt Suomessa. Nyt verkosto on laajentunut valtakunnalliseksi viiteen kaupunkiin ja kahteen ammattikorkeakouluun Suomen itsenäisyyden juhlarahaston Sitran rahoituksen avulla. Myös Oulu on mukana.
Kaupungeissa hulevesitulvat yleistyvät – kuilua ohjeiden ja kaavoituksen välillä23.2.2026 06:07:00 EET | Tiedote
Kaupunkitulvien riski kasvaa, kun ilmaston ääri-ilmiöt lisääntyvät ja yhä tiiviimpi rakentaminen vähentää viheralueita ja vettä läpäisemättömiä pintoja.
Psykoosilääkkeiden off label -käyttö yleistä ikääntyneillä23.2.2026 04:45:00 EET | Tiedote
Psykoosilääkkeiden käyttö muuhun kuin virallisesti hyväksyttyyn käyttötarkoitukseen on yleistä ikääntyneiden keskuudessa. Asia käy ilmi Oulun ja Itä-Suomen yliopistojen laajasta rekisteritutkimuksesta, jossa tarkasteltiin psykoosilääkkeiden niin sanottua off label -käyttöä kotona asuvilla iäkkäillä henkilöillä. Off label -käytössä lääkäri määrää lääkkeen muuhun kuin sen virallisesti hyväksyttyyn käyttöaiheeseen.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme
