Uusilla metodeilla voi analysoida tekstin tunnelatauksia entistä paremmin

Oletko törmännyt kauppojen tai ravintoloiden hymynaamanappeihin, joilla annetaan palautetta? Seurataanko työpaikkasi brändikuvaa somessa? Tämä seuranta on itsessään jo sentimenttianalyysia. Lähes kaikki somedata käy Emily Öhmanin mukaan läpi sentimenttianalyysin.
– Olen soveltanut sentimenttianalyysin työkaluja vihapuheen tunnistamiseen, kaunokirjallisuuden tunnemaailman analysoimiseen sekä poliittisten puolueiden retoriikan tutkimiseen.
Tunnesanalistat ovat edullinen metodi
Kieliteknologiassa sentimenttianalyysia kehitetään lähinnä koneoppimisen tarkoituksiin, mikä on kuitenkin muiden alojen näkökulmasta kallista ja vaivalloista. Luotettavia tuloksia voidaan saavuttaa edullisemmin tunnesanalistojen avulla. Se on yksinkertaisempi metodi, joka avaa monille aloille mahdollisuuksia toteuttaa sentimenttianalyysia.
– Tunnesanalista on yksinkertaisimmillaan lista sanoja, jotka on yhdistetty tiettyyn tunteeseen. Sanat on kerätty esimerkiksi sanakirjoista. Tunnesanalista voi kuvastaa tunnetta, joka yhdistetään tiettyyn sanaan, tai sanan herättämiä tunteita. Esimerkiksi sana ”murhata” voi olla tunnesanalistassa yhdistetty sentimenttiin ”negatiivinen” ja tunteisiin ”viha”, ”pelko” ja ”suru”. Tutkija voi laskea, montako tiettyä tunnetta edustavaa sanaa tietystä tekstistä löytyy.
Osana tutkimustaan Öhman on luonut suomenkielisen tunnesanalistan ja tunneluokitellun datasetin 42 kielelle. Datasettiä käytetään opettamaan koneoppimismallille, minkälaisissa konteksteissa eri tunteita esiintyy.
Tunne auttaa analysoimaan tekstiä
Öhman kertoo, että kielestä toiseen käännettäessä tunteet säilyvät teksteissä eri tavoin.
– Tämä havainto voi auttaa sekä kääntäjiä että konekääntämisen kehittäjiä. Tutkimuksessani kävi ilmi, että englannista suomeen ja ranskaan käännettäessä sana ”ilo” säilyy parhaiten, mutta italiaan käännettäessä taas ”suru”. Kaikissa kielissä sana ”yllätys” säilyy huonoiten, koska se on tunteena muutenkin vaikea tunnistaa tekstissä, ja se voi olla sekä positiivinen, negatiivinen että neutraali.
Yrityksissä sentimenttianalyysia on jo pitkään käytetty oman brändin seuraamiseen somessa.
– Tämä on mahdollistanut nopeankin reagoinnin ongelmatapauksissa. Nyt tämä on entistä helpompaa tehdä suomenkieliselle tekstille.
Öhmanin laatimia aineistoja voi hyödyntää myös esimerkiksi silloin, kun tutkitaan, miten mediassa keskustellaan eri puolueista. Aineiston avulla voi käydä läpi kymmeniä vuosia artikkeleita tai somekeskusteluja ja tarkastella, mitä tunteita tutkittavaan asiaan yhdistetään tai mitä tunteita siitä keskusteltaessa ilmaistaan.
– Tutkimukseni osoittaa, että vihapuheviestit sisältävät enemmän tunnesanoja, myös positiivisia, kuin ne viestit, joissa ei ole vihapuhetta. Tämä tieto auttaa kehittämään tarkempia automaattisia moderaattoreita somealustoille.
***
MA Emily Öhman väittelee 5.3.2021 kello 16 Helsingin yliopiston humanistisessa tiedekunnassa aiheesta "The Language of Emotions - Building and Applying Computational Methods for Emotion Detection for English and Beyond". Väitöstilaisuus järjestetään osoitteessa Zoom.
Vastaväittäjänä on Associate Professor Cecilia Ovesdotter Alm, Rochester Institute of Technology, ja kustoksena on professori Jörg Tiedemann.
Väitöskirja on myös elektroninen julkaisu ja luettavissa Heldassa.
Live stream passcode: 71502
Avainsanat
Yhteyshenkilöt
FM Emily Öhman
emily.ohman@helsinki.fi
040-3526140
Kuvat

Linkit
Tietoja julkaisijasta

PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Lasten hankinnan lykkääminen pienentää lasten lukumäärää ja lisää eriarvoisuutta9.9.2025 10:23:52 EEST | Tiedote
Raskauden lykkääminen vähentää lasten kokonaismäärää ja lisää äidin terveydentilaan liittyvien riskitekijöiden aiheuttamaa eriarvoisuutta.
Äidin vaikeudet kiintyä vauvaan lisäävät lapsen uniongelmia8.9.2025 07:07:00 EEST | Tiedote
Seurantatutkimus osoittaa, että äidin vaikeudet kiintyä vauvaan kahdeksan kuukauden iässä ovat yhteydessä lapsen lisääntyneisiin uniongelmiin ja ne näkyvät vielä 2-vuotiaankin lapsen unessa.
Lapsuuden ystävyyssuhteiden puute altistaa itsemurha-ajatuksille yli 50-vuotiailla3.9.2025 08:30:00 EEST | Tiedote
Lapsuuden epäsuotuisat olosuhteet lisäävät itsemurha-ajatusten riskiä myöhemmällä iällä, ilmenee Helsingin yliopiston kansainvälisestä tutkimuksesta.
Majavat ovat palanneet metsämaisemaan ja elvyttävät sen luontoa2.9.2025 15:58:23 EEST | Tiedote
Pitkäaikainen tutkimus yli 50 vuoden ajalta kuvaa miten Evolle palanneet majavat ovat monimuotoistaneet elinympäristöjä. Se kertoo niiden merkittävästä roolista niin kutsuttuina ekosysteemi-insinööreinä, jotka mahdollistavat laajemman lajikirjon alueella.
Rikoslain ihmiskäsitys on ristiriitainen ja luo epäoikeudenmukaisuutta2.9.2025 08:30:32 EEST | Tiedote
Rikosoikeutta ohjaavat ajatukset perustuvat enemmän politiikkaan ja moraaliin kuin tutkittuun tietoon, sanoo Esko Yli-Hemminki, jonka väitöstutkimus käsittelee rikosoikeuden ihmiskäsitystä.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme