Helsingin yliopisto

Uusilla metodeilla voi analysoida tekstin tunnelatauksia entistä paremmin

Jaa
Sentimentti- eli tunneanalyysilla tutkitaan erilaisissa teksteissä esiintyviä tunteita. Tutkija Emily Öhman vertailee väitöstutkimuksessaan sentimenttianalyysin eri metodeja ja luo uusia työkaluja sen käyttöön. Hän kehitti olemassa olevien analyysivälineiden luotettavuutta ja mahdollisti niiden käytön suomen kielellä.
Kuva: Mostphotos. Kuvaa saa käyttää Helsingin yliopiston tutkimuksesta, opetuksesta tai muusta toiminnasta kertovien esitysten tai materiaalien yhteydessä. Muu käyttö tai kuvien luovuttaminen kolmansien osapuolien käyttöön on kielletty. Kuvaajan tai kuvapankin nimi mainittava, jos se on tiedossa; lähteenä mainittava Helsingin yliopisto.
Kuva: Mostphotos. Kuvaa saa käyttää Helsingin yliopiston tutkimuksesta, opetuksesta tai muusta toiminnasta kertovien esitysten tai materiaalien yhteydessä. Muu käyttö tai kuvien luovuttaminen kolmansien osapuolien käyttöön on kielletty. Kuvaajan tai kuvapankin nimi mainittava, jos se on tiedossa; lähteenä mainittava Helsingin yliopisto.

Oletko törmännyt kauppojen tai ravintoloiden hymynaamanappeihin, joilla annetaan palautetta? Seurataanko työpaikkasi brändikuvaa somessa? Tämä seuranta on itsessään jo sentimenttianalyysia. Lähes kaikki somedata käy Emily Öhmanin mukaan läpi sentimenttianalyysin.

– Olen soveltanut sentimenttianalyysin työkaluja vihapuheen tunnistamiseen, kaunokirjallisuuden tunnemaailman analysoimiseen sekä poliittisten puolueiden retoriikan tutkimiseen.

Tunnesanalistat ovat edullinen metodi

Kieliteknologiassa sentimenttianalyysia kehitetään lähinnä koneoppimisen tarkoituksiin, mikä on kuitenkin muiden alojen näkökulmasta kallista ja vaivalloista. Luotettavia tuloksia voidaan saavuttaa edullisemmin tunnesanalistojen avulla. Se on yksinkertaisempi metodi, joka avaa monille aloille mahdollisuuksia toteuttaa sentimenttianalyysia.

– Tunnesanalista on yksinkertaisimmillaan lista sanoja, jotka on yhdistetty tiettyyn tunteeseen. Sanat on kerätty esimerkiksi sanakirjoista. Tunnesanalista voi kuvastaa tunnetta, joka yhdistetään tiettyyn sanaan, tai sanan herättämiä tunteita. Esimerkiksi sana ”murhata” voi olla tunnesanalistassa yhdistetty sentimenttiin ”negatiivinen” ja tunteisiin ”viha”, ”pelko” ja ”suru”. Tutkija voi laskea, montako tiettyä tunnetta edustavaa sanaa tietystä tekstistä löytyy.

Osana tutkimustaan Öhman on luonut suomenkielisen tunnesanalistan ja tunneluokitellun datasetin 42 kielelle. Datasettiä käytetään opettamaan koneoppimismallille, minkälaisissa konteksteissa eri tunteita esiintyy.

Tunne auttaa analysoimaan tekstiä

Öhman kertoo, että kielestä toiseen käännettäessä tunteet säilyvät teksteissä eri tavoin.

– Tämä havainto voi auttaa sekä kääntäjiä että konekääntämisen kehittäjiä. Tutkimuksessani kävi ilmi, että englannista suomeen ja ranskaan käännettäessä sana ”ilo” säilyy parhaiten, mutta italiaan käännettäessä taas ”suru”. Kaikissa kielissä sana ”yllätys” säilyy huonoiten, koska se on tunteena muutenkin vaikea tunnistaa tekstissä, ja se voi olla sekä positiivinen, negatiivinen että neutraali.

Yrityksissä sentimenttianalyysia on jo pitkään käytetty oman brändin seuraamiseen somessa.

– Tämä on mahdollistanut nopeankin reagoinnin ongelmatapauksissa. Nyt tämä on entistä helpompaa tehdä suomenkieliselle tekstille.

Öhmanin laatimia aineistoja voi hyödyntää myös esimerkiksi silloin, kun tutkitaan, miten mediassa keskustellaan eri puolueista. Aineiston avulla voi käydä läpi kymmeniä vuosia artikkeleita tai somekeskusteluja ja tarkastella, mitä tunteita tutkittavaan asiaan yhdistetään tai mitä tunteita siitä keskusteltaessa ilmaistaan.

– Tutkimukseni osoittaa, että vihapuheviestit sisältävät enemmän tunnesanoja, myös positiivisia, kuin ne viestit, joissa ei ole vihapuhetta. Tämä tieto auttaa kehittämään tarkempia automaattisia moderaattoreita somealustoille.

***

MA Emily Öhman väittelee 5.3.2021 kello 16 Helsingin yliopiston humanistisessa tiedekunnassa aiheesta "The Language of Emotions - Building and Applying Computational Methods for Emotion Detection for English and Beyond". Väitöstilaisuus järjestetään osoitteessa Zoom.

Vastaväittäjänä on Associate Professor Cecilia Ovesdotter Alm, Rochester Institute of Technology, ja kustoksena on professori Jörg Tiedemann.

Väitöskirja on myös elektroninen julkaisu ja luettavissa Heldassa.

Live stream

Live stream passcode: 71502

Avainsanat

Yhteyshenkilöt

FM Emily Öhman
emily.ohman@helsinki.fi
040-3526140

Kuvat

Kuva: Mostphotos. Kuvaa saa käyttää Helsingin yliopiston tutkimuksesta, opetuksesta tai muusta toiminnasta kertovien esitysten tai materiaalien yhteydessä. Muu käyttö tai kuvien luovuttaminen kolmansien osapuolien käyttöön on kielletty. Kuvaajan tai kuvapankin nimi mainittava, jos se on tiedossa; lähteenä mainittava Helsingin yliopisto.
Kuva: Mostphotos. Kuvaa saa käyttää Helsingin yliopiston tutkimuksesta, opetuksesta tai muusta toiminnasta kertovien esitysten tai materiaalien yhteydessä. Muu käyttö tai kuvien luovuttaminen kolmansien osapuolien käyttöön on kielletty. Kuvaajan tai kuvapankin nimi mainittava, jos se on tiedossa; lähteenä mainittava Helsingin yliopisto.
Lataa

Linkit

Tietoja julkaisijasta

Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.

Tilaa tiedotteet sähköpostiisi

Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.

Lue lisää julkaisijalta Helsingin yliopisto

Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.

Tutustu uutishuoneeseemme
HiddenA line styled icon from Orion Icon Library.Eye