Uusilla metodeilla voi analysoida tekstin tunnelatauksia entistä paremmin
Oletko törmännyt kauppojen tai ravintoloiden hymynaamanappeihin, joilla annetaan palautetta? Seurataanko työpaikkasi brändikuvaa somessa? Tämä seuranta on itsessään jo sentimenttianalyysia. Lähes kaikki somedata käy Emily Öhmanin mukaan läpi sentimenttianalyysin.
– Olen soveltanut sentimenttianalyysin työkaluja vihapuheen tunnistamiseen, kaunokirjallisuuden tunnemaailman analysoimiseen sekä poliittisten puolueiden retoriikan tutkimiseen.
Tunnesanalistat ovat edullinen metodi
Kieliteknologiassa sentimenttianalyysia kehitetään lähinnä koneoppimisen tarkoituksiin, mikä on kuitenkin muiden alojen näkökulmasta kallista ja vaivalloista. Luotettavia tuloksia voidaan saavuttaa edullisemmin tunnesanalistojen avulla. Se on yksinkertaisempi metodi, joka avaa monille aloille mahdollisuuksia toteuttaa sentimenttianalyysia.
– Tunnesanalista on yksinkertaisimmillaan lista sanoja, jotka on yhdistetty tiettyyn tunteeseen. Sanat on kerätty esimerkiksi sanakirjoista. Tunnesanalista voi kuvastaa tunnetta, joka yhdistetään tiettyyn sanaan, tai sanan herättämiä tunteita. Esimerkiksi sana ”murhata” voi olla tunnesanalistassa yhdistetty sentimenttiin ”negatiivinen” ja tunteisiin ”viha”, ”pelko” ja ”suru”. Tutkija voi laskea, montako tiettyä tunnetta edustavaa sanaa tietystä tekstistä löytyy.
Osana tutkimustaan Öhman on luonut suomenkielisen tunnesanalistan ja tunneluokitellun datasetin 42 kielelle. Datasettiä käytetään opettamaan koneoppimismallille, minkälaisissa konteksteissa eri tunteita esiintyy.
Tunne auttaa analysoimaan tekstiä
Öhman kertoo, että kielestä toiseen käännettäessä tunteet säilyvät teksteissä eri tavoin.
– Tämä havainto voi auttaa sekä kääntäjiä että konekääntämisen kehittäjiä. Tutkimuksessani kävi ilmi, että englannista suomeen ja ranskaan käännettäessä sana ”ilo” säilyy parhaiten, mutta italiaan käännettäessä taas ”suru”. Kaikissa kielissä sana ”yllätys” säilyy huonoiten, koska se on tunteena muutenkin vaikea tunnistaa tekstissä, ja se voi olla sekä positiivinen, negatiivinen että neutraali.
Yrityksissä sentimenttianalyysia on jo pitkään käytetty oman brändin seuraamiseen somessa.
– Tämä on mahdollistanut nopeankin reagoinnin ongelmatapauksissa. Nyt tämä on entistä helpompaa tehdä suomenkieliselle tekstille.
Öhmanin laatimia aineistoja voi hyödyntää myös esimerkiksi silloin, kun tutkitaan, miten mediassa keskustellaan eri puolueista. Aineiston avulla voi käydä läpi kymmeniä vuosia artikkeleita tai somekeskusteluja ja tarkastella, mitä tunteita tutkittavaan asiaan yhdistetään tai mitä tunteita siitä keskusteltaessa ilmaistaan.
– Tutkimukseni osoittaa, että vihapuheviestit sisältävät enemmän tunnesanoja, myös positiivisia, kuin ne viestit, joissa ei ole vihapuhetta. Tämä tieto auttaa kehittämään tarkempia automaattisia moderaattoreita somealustoille.
***
MA Emily Öhman väittelee 5.3.2021 kello 16 Helsingin yliopiston humanistisessa tiedekunnassa aiheesta "The Language of Emotions - Building and Applying Computational Methods for Emotion Detection for English and Beyond". Väitöstilaisuus järjestetään osoitteessa Zoom.
Vastaväittäjänä on Associate Professor Cecilia Ovesdotter Alm, Rochester Institute of Technology, ja kustoksena on professori Jörg Tiedemann.
Väitöskirja on myös elektroninen julkaisu ja luettavissa Heldassa.
Live stream passcode: 71502
Avainsanat
Yhteyshenkilöt
FM Emily Öhman
emily.ohman@helsinki.fi
040-3526140
Kuvat
Linkit
Tietoja julkaisijasta
PL 3
00014 Helsingin yliopisto
02941 22622 (mediapalvelu) 02941 911 (vaihde) (vaihde)https://www.helsinki.fi/fi/yliopisto
Helsingin yliopisto on yli 40 000 opiskelijan ja työntekijän kansainvälinen tiedeyhteisö, joka toimii neljällä kampuksella Helsingissä ja usealla muulla paikkakunnalla Suomessa. Kansainvälisissä yliopistovertailuissa se on ollut toistuvasti maailman sadan parhaan yliopiston joukossa. Helsingin yliopisto on perustettu vuonna 1640.
Tilaa tiedotteet sähköpostiisi
Haluatko tietää asioista ensimmäisten joukossa? Kun tilaat tiedotteemme, saat ne sähköpostiisi välittömästi julkaisuhetkellä. Tilauksen voit halutessasi perua milloin tahansa.
Lue lisää julkaisijalta Helsingin yliopisto
Helsingin yliopiston operatiivinen tulos 2023 oli 16 miljoonaa euroa miinuksella17.4.2024 14:37:06 EEST | Tiedote
Varainhankinta sekä sijoitus- ja rahoitustuotot nostivat kokonaistuloksen plussalle. Yliopisto lisää sijoitustoiminnan tuotonjakoa perustehtävään seuraavien viiden vuoden ajan.
Pelastakaa tiede! -dokumenttielokuva kertoo tieteen evakuoinnin tarinan17.4.2024 10:28:01 EEST | Tiedote
Kirjailija, FT Anna Kortelainen, Kansalliskirjasto ja Kirjastokaista ovat tuottaneet yhteistyössä dokumentin, joka pureutuu Kansalliskirjaston aineistojen evakuointiin talvi- ja jatkosodan aikana. Elokuva julkaistaan 17.4.2024 Kirjastokaistan verkkosivuilla sekä Kansalliskirjaston Youtube-kanavalla.
Kutsu medialle: Tule seuraamaan Viikin tutkimustilan lehmien keväistä laitumellelaskua 4.5.!15.4.2024 14:44:21 EEST | Tiedote
Helsingin yliopisto, Valio ja maatalousylioppilaiden yhdistys Sampsa kutsuvat median edustajat osallistumaan Suomen urbaanimpien lehmien laitumellelaskuun Viikin tutkimustilalla lauantaina 4. toukokuuta.
Diabeteslääke voi tehostaa immuunipuolustuksen taistelua rintasyöpää vastaan12.4.2024 10:11:23 EEST | Tiedote
Tyypin 2 diabeteslääke metformiini voi tutkimuksen mukaan auttaa elimistön immuunijärjestelmää tunnistamaan paremmin syöpäsoluja ja tehostaa puolustusreaktiota niitä vastaan.
Suurten suojelualueiden merkitys korostuu pohjoisten lintulajien suojelussa12.4.2024 09:31:44 EEST | Tiedote
Nykyinen suojelualueverkosto ei riitä hidastamaan kylmään sopeutuneiden, pohjoisten lajien, kuten järripeipon, taantumista pohjoisella pallonpuoliskolla, osoittaa Helsingin yliopiston tuore tutkimus. Tehokkain tapa hidastaa pohjoisten lajien häviämistä on suurten suojelualueiden perustaminen.
Uutishuoneessa voit lukea tiedotteitamme ja muuta julkaisemaamme materiaalia. Löydät sieltä niin yhteyshenkilöidemme tiedot kuin vapaasti julkaistavissa olevia kuvia ja videoita. Uutishuoneessa voit nähdä myös sosiaalisen median sisältöjä. Kaikki tiedotepalvelussa julkaistu materiaali on vapaasti median käytettävissä.
Tutustu uutishuoneeseemme