Digitaalinen uutissilmä lukee jutut menneistä tapahtumista ja vieläpä selittää ne uusille lukijoilleen
Helsingin yliopiston monitieteinen tutkimushanke, NewsEye, ’uutissilmä’ on saanut rahoituksen, jonka avulla digitaalisen humanismin tutkijat, tietojenkäsittelytieteen asiantuntijat ja kirjastoalan asiantuntijat pääsevät työskentelemään digitoidun muistiaineiston parissa. He halusivat yhteistyöhön, jotta muistiaineiston tarvitsijat, niin tutkijat, opettajat kuin muutkin, saavat käytettäviä ja relevantteja tuloksia käyttöönsä.
Tekoälyn keinoin automatisoitua datatiedettä
Tutkimuksen painopiste on datatieteessä, ja sitä johtaa professori Hannu Toivonen.
– Mielenkiintoisin kehityskohde on automatisoitu tutkimusavustaja, joka käyttää itsenäisesti projektissa kehitettäviä uusia työkaluja etsiäkseen käyttäjälle kiinnostavia tuloksia. Se myös raportoi löydöksistä selkeästi kirjallisesti ja osaa selittää löydöksiä ja omaa toimintaansa. Siihen me nyt Helsingissä tähtäämme, luovan tietojenkäsittelyn asiantuntijana tunnettu professori Toivonen sanoo.
Mikkelissä digitoiduista sanomalehdistä tuli koneluettavaa big data -aineistoa
Liikkeelle lähdetään Kansalliskirjaston jo digitoidusta aineistosta. Tavoitteena on tekstin automaattinen tunnistus digitoidusta materiaalista, kuvan muuttaminen tekstiksi ja erillisten artikkeleiden tunnistaminen.
NewsEye-hankkeen aineistoksi Kansalliskirjasto toimittaa historiallista suomalaista sanomalehtiaineistoa vuosilta 1771 – 1910. Kansalliskirjaston laaja digitointituotanto tehdään sen Mikkelissä sijaitsevassa toimipisteessä, ja kirjasto on digitoinut kaikki suomalaiset ilmestyneet sanomalehdet tältä ajalta ja tehnyt niistä koneluettavan datapaketin. Aineistoa täydennetään vielä vuosien 1911 – 1917 sanomalehtiaineistoilla.
Työkalu rikastetun tekstin analysointiin erilaisista näkökulmista
Työn alla on myös tekstin automaattinen rikastaminen tunnistamalla tekstistä nimiä ja asenteita. Suomalaistutkijat keskittyvät myös kehittämään uusia työkaluja rikastetun tekstin analysointiin erilaisista näkökulmista niin, että eri asiayhteydet ja vertailukohdat tulevat huomioiduksi.
Hannu Toivonen antaa esimerkin siitä, miten automatisoitu tutkimusavustaja toimisi, silloin kun asiayhteydet ja vertailukohdat on huomattu:
– Ajatellaan, että käyttäjä on kiinnostunut sukunsa historiasta ja antaa tarkastelun kohteeksi sukunimensä. Silloin tutkimusavustaja etsii sukunimeä vanhoista lehdistä ja katsoo myös missä yhteyksissä nimi esiintyy. Avustaja huomaa, että kyseessä on sukunimi, vertaa sen asiayhteyksiä muiden sukunimien asiayhteyksiin, ja kertoo käyttäjälle sitten, mitkä asiayhteydet korostuvat erityisesti annetun sukunimen yhteydessä. Sen jälkeen avustaja voi edelleen raportoida, miten asiayhteydet ovat muuttuneet ajan kuluessa, Toivonen kuvaa uutta avustajaa.
Parhaimmillaan jopa rinnakkain useita kieliä käsittelevä hanke
Helsingin yliopiston rahoitusosuus on 900 000 euroa tieteidenvälisessä H2020-projektissa NewsEye: A Digital Investigator for Historical Newspapers. Työ on juuri alkanut ja kestää 3 vuotta. Kokonaisuutena hankkeen eurooppalainen rahoitus on 3 miljoonaa euroa.
Helsingin yliopistosta mukana ovat Hannu Toivonen, Mikko Tolosen digitaalisten ihmistieteiden tutkijaryhmä ja Kansalliskirjastosta Minna Kaukonen työryhmineen. Vastaavat monitieteiset kolmikot ovat mukana myös Ranskasta ja Itävallasta, lisäksi mukana on yksi saksalainen partneri.
Hankkeessa uutuutena on monikielisyys: menetelmät ja työkalut tehdään mahdollisimman kieliriippumattomiksi tai parhaimmillaan jopa rinnakkain useita kieliä käsitteleviksi. Tämä on tutkijoiden mukaan tärkeää — mutta harvinaista — eurooppalaisessa kontekstissa.
Lue lisää:
Tutustu Suomen historiaan ja menneeseen aikaan digitoitujen sanomalehtien kautta. Kansalliskirjaston digitaaliset aineistot: https://digi.kansalliskirjasto.fi/sanomalehti/search
HELDIG, Helsinki Centre for Digital Humanities, on digitalisaatiota tukeva yhteistyöverkosto, jossa uusimmat tietojenkäsittelyn menetelmät valjastetaan humanistisen ja yhteiskunnallisen tutkimuksen käyttöön: https://www.helsinki.fi/en/helsinki-centre-for-digital-humanities
HIDATA, Helsinki Centre for Data Science on monitieteinen datatiedettä kehittävä Helsingin yliopiston ja Aalto-yliopiston yhteistyöverkosto: https://www.helsinki.fi/en/helsinki-centre-for-data-science
Tervetuloa mukaan!
HIDATA järjestää datatieteen päivän Helsingin Tiedekulmassa tiistaina 29.5. kello 9-15. Kaikki ovat tervetulleita!
Kuva:
Kuvakaappaus Kansalliskirjaston historiallisia aineistoista Digi.Kansalliskirjasto.fi - sivulta: https://digi.kansalliskirjasto.fi/etusivu
Yhteystiedot:
Hannu Toivonen, matemaattis-luonnontieteellinen tiedekunta, hannu.toivonen@helsinki.fi, http://www.cs.helsinki.fi/hannu.toivonen/, 050 9112405
Minna Kaukonen, Kansalliskirjasto, minna.kaukonen@helsinki.fi, 050 4155 450
Mikko Tolonen, Kansalliskirjasto, mikko.tolonen@helsinki.fi, 050 448 2055
Viestinnän asiantuntija Minna Meriläinen-Tenhu, @MinnaMeriTenhu, 050 415 0316, minna.merilainen@helsinki.fi
Yhteyshenkilöt
Minna Meriläinen-Tenhuviestinnän asiantuntija
Puh:+358 50 415 0316minna.merilainen@helsinki.fihttp://blogs.helsinki.fi/mmerilai/Kuvat
Tietoja julkaisijasta
PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen yhteisö, joka tuottaa tieteen voimalla kestävää tulevaisuutta koko maailman parhaaksi. Kansainvälisissä yliopistovertailuissa Helsingin yliopisto sijoittuu maailman parhaan yhden prosentin joukkoon. Monitieteinen yliopisto toimii neljällä kampuksella Helsingissä sekä Lahden, Mikkelin ja Seinäjoen yliopistokeskuksissa. Lisäksi sillä on kuusi tutkimusasemaa eri puolilla Suomea ja yksi Keniassa. Yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Eduskuntavaalitutkimus 2023 julkistamistilaisuus 13.5. Helsingin yliopiston valtiotieteellisessä tiedekunnassa25.4.2024 11:02:23 EEST | Kutsu
Lämpimästi tervetuloa ”Pääministerivaalit polarisaation aikakaudella: Eduskuntavaalitutkimus 2023” julkistamistilaisuuteen 13.5. klo 10-12 . Nyt julkaistava eduskuntavaalitutkimuksen pääraportti on kattava teos suomalaisten äänestäjien käyttäytymisestä 2023 eduskuntavaaleissa.
Iäkkäiden lääkehoidon riskitekijöiden tunnistaminen on avainasemassa kotona asumisen tukemisessa23.4.2024 09:58:40 EEST | Tiedote
Tuoreessa väitöstutkimuksessa on kehitetty malli iäkkäiden lääkehoidon riskitekijöiden tunnistamiseksi osana laajempaa terveystarkastusta. Tutkimuksen tavoitteena oli tarjota konkreettisia keinoja iäkkäiden terveyden ja toimintakyvyn ylläpitämiseksi, jotta he voisivat asua kotona mahdollisimman pitkään.
Helsingin yliopiston operatiivinen tulos 2023 oli 16 miljoonaa euroa miinuksella17.4.2024 14:37:06 EEST | Tiedote
Varainhankinta sekä sijoitus- ja rahoitustuotot nostivat kokonaistuloksen plussalle. Yliopisto lisää sijoitustoiminnan tuotonjakoa perustehtävään seuraavien viiden vuoden ajan.
Pelastakaa tiede! -dokumenttielokuva kertoo tieteen evakuoinnin tarinan17.4.2024 10:28:01 EEST | Tiedote
Kirjailija, FT Anna Kortelainen, Kansalliskirjasto ja Kirjastokaista ovat tuottaneet yhteistyössä dokumentin, joka pureutuu Kansalliskirjaston aineistojen evakuointiin talvi- ja jatkosodan aikana. Elokuva julkaistaan 17.4.2024 Kirjastokaistan verkkosivuilla sekä Kansalliskirjaston Youtube-kanavalla.
Kutsu medialle: Tule seuraamaan Viikin tutkimustilan lehmien keväistä laitumellelaskua 4.5.!15.4.2024 14:44:21 EEST | Tiedote
Helsingin yliopisto, Valio ja maatalousylioppilaiden yhdistys Sampsa kutsuvat median edustajat osallistumaan Suomen urbaanimpien lehmien laitumellelaskuun Viikin tutkimustilalla lauantaina 4. toukokuuta.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme