Oulun yliopisto

Tekoäly apuna koltansaamen ja pohjoissaamen digitaalisten sanakirjojen toimitustyössä

Jaa

Oulun yliopiston Giellagas-instituutti julkaisee koltansaamen ja pohjoissaamen sanakirjat digitaalisina. Tekijät ovat hyödyntäneet työssä tekoälyä.

Sanakirjojen kehitys ja niiden digitalisointi ovat osa vähemmistökielten kuvausta ja elvytystä. Digitalisoinnin ansiosta kieliä voidaan nykyaikaistaa ja käännettyjen sanojen määrää lisätä verrattuna painettuihin sanakirjoihin. Digitaalisessa muodossa olevaa sanakirjaa on helppo täydentää, laajentaa ja korjata sitä mukaa kuin tiedot kielen sanavaroista ja kirjakielen normeista täsmentyvät.

Esimerkiksi koltansaame on kehittyvä kirjakieli, jonka kirjallinen käyttö on viime vuosina laajentunut uusille alueille. Sanasto on merkittävästi kasvanut, ja sen uudistuminen on ollut erityisen nopeaa viimeisen vuosikymmenen aikana.

Oulun yliopistossa on aloitettu tänä vuonna koltansaamen pääaineopetus.

”Koltansaamen digitaalisen sanakirjan merkitys on erittäin suuri. Näin ajantasaista, nykykieltä sisältävää sanakirjaa ei koltansaamessa ole lainkaan. Digitaalisen sanakirjan julkaiseminen on merkittävä edistysaskel myös opetuksen kannalta. Tärkeää on myös se, että kolttasaamelaiset itse ovat olleet mukana tekemässä tätä työtä”, Giellagas-instituutin johtaja Anni-Siiri Länsman toteaa.

Digitaalisten sanakirjojen toteutuksessa on käytetty pienten kielten sanakirjatyötä varten Helsingin yliopistossa kehitettyä Veʹrdd-työkalua. Työkalu hyödyntää tekoälyä, joka muun muassa taivuttaa sanoja automaattisesti eri muotoihin. Tekoäly säästää sanakirjatyöhön kuluvaa aikaa, sillä jokaisen sanan kaikkia taivutusmuotoja ei tarvitse kirjoittaa käsin. Käyttäjällä on myös mahdollisuus korjata tekoälyn tuottamia virheellisiä muotoja.

Sanakirjan koneluettavuus mahdollistaa sen, että korjaukset voidaan syöttää takaisin tekoälylle, jolloin sen käsitys kielen taivutusmuodoista tarkentuu. Samaa tekoälyä ja Ve’rddillä tuotettua sanastoa voidaan käyttää suoraan myös oikolukusovelluksissa ja kielenopetusohjelmissa.

Digitaalisessa suomi–koltansaame-sanakirjassa suomenkielisten hakusanojen määrä on yli 16 000 ja koltankielisten vastineiden lähes 19 000. Digitaalisessa pohjoissaame–suomi-sanakirjassa on runsaat 50 000 hakusanaa. Sen käsikirjoituksen on tehnyt emeritusprofessori Pekka Sammallahti aikaisempien sanakirjojensa (1989 ja 1993) pohjalta.

Digitaaliset sanakirjat julkaistaan Tromssan yliopiston saamen kieliteknologian keskuksen Giellateknon ja Divvun-projektin alustalla:

suomi–koltansaame-sanakirja https://saan.oahpa.no/fin/sms/

pohjoissaame–suomi-sanakirja http://satni.org/sammallahtismefin

Digitaalisten sanakirjojen julkaisutilaisuus pidetään 25.8.2020 klo 10 ja sitä voi seurata osoitteessa https://oulu.zoom.us/j/69319349687

Molempien sanakirjojen toimitustyö on tehty pääosin opetus- ja kulttuuriministeriön Oulun yliopiston Giellagas-instituutille myöntämän erityisrahoituksen turvin. Suomi–koltansaame-sanakirjan toteutus on Oulun yliopiston Giellagas-instituutin, Helsingin yliopiston, Tromssan yliopiston ja Saamelaiskäräjien yhteistyötä.

Giellagas-instituutilla on valtakunnallinen vastuu järjestää ja edistää saamen kielen ja saamelaisen kulttuurin ylintä opetusta ja tutkimusta Suomessa.

Avainsanat

Yhteyshenkilöt

Lisätietoja:

johtaja Anni-Siiri Länsman, Giellagas-instituutti, Oulun yliopisto, p. 040 5143781, anni-siiri.lansman@oulu.fi
yliopisto-opettaja Miika Lehtinen, Giellagas-instituutti, Oulun yliopisto, p. 050 5692300, miika.lehtinen@oulu.fi
viestintäasiantuntija Anna-Maria Hietapelto, p. 040 7650015, Oulun yliopisto, anna-maria.hietapelto@oulu.fi

Linkit

Tietoja julkaisijasta

Oulun yliopisto
Oulun yliopisto
Pentti Kaiteran katu 1
90570 Oulu

0294 480 000http://www.oulu.fi/yliopisto/

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat mediatiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Oulun yliopisto

Uusi ultranopea NMR-menetelmä molekyylien vaihdon tutkimiseen18.9.2020 10:15:00 EESTTiedote

Molekyylien vaihto erilaisten fysikaalisten tai kemiallisten ympäristöjen välillä on erittäin merkittävässä roolissa monissa tärkeissä prosesseissa, kuten hengityksessä, proteiinien laskostumisessa, kemiallisissa reaktioissa ja katalyysissä. Oulun yliopiston NMR-spektroskopian tutkimusyksikkö on kehittänyt ultranopean NMR-menetelmän, jolla molekyylien vaihdon havaitsemista voidaan nopeuttaa jopa 10 000-kertaisesti. Menetelmää hyödynnetään ilmastonmuutoksen tutkimuksessa ilmakehän aerosolien koostumuksen ymmärtämiseen yhteistyössä Oulun yliopiston Nano- ja molekyylisysteemien tutkimusyksikön kanssa.

Oulun yliopisto avaa viisi uutta kansainvälistä koulutusta: epidemiologiaa, kestävää kemiaa, monialaista business-analytiikkaa ja osaajia ICT-alalle17.9.2020 06:00:00 EESTTiedote

Kansainvälisen koulutustarjonnan kasvattamisen taustalla on erityisosaamisen kysyntä, ja tutkinto-ohjelmia on suunniteltu sidosryhmiä kuunnellen. Uusien koulutusohjelmien tavoitteena on vahvistaa Oulun yliopiston tarjoaman koulutuksen vetovoimaa. Kansainvälisissä tutkinnoissa opetus tapahtuu kokonaan englanniksi.

Metsäsertifiointia tiukennettava pienvesien suojelun tehostamiseksi11.9.2020 12:50:00 EESTTiedote

Tuoreen tutkimuksen mukaan valtaosaan Suomen talousmetsistä sovellettu PEFC-sertifikaatti on suojavyöhykkeen leveyden suhteen riittämätön eikä tarjoa suojaa metsäpuroille avohakkuiden vaikutuksilta. PEFC-sertifikaatin mukaisesti suojelluissa puroissa ympäristöolot poikkesivat metsätalouden toimenpiteiden ulkopuolelle jääneistä vertailupuroista ja johtivat puroeliöstön monimuotoisuuden köyhtymiseen.

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme